Российское издательство изпользует нейросети для цензурирования ЛГБТ тематики

В начале декабря представители российского издательства Ridero рассказали журналистам, что используют нейросети для поиска произведений с ЛГБТ тематикой в своей библиотеке, которая насчитывает более 100 000 наименований. Обнаруженные издания будут изыматься из продажи в связи с вступившим в силу законом «о запрете пропаганды ЛГБТ». Об этом сообщает издание «Коммерсантъ».

5 декабря в России вступил в силу пакет законов о полном запрете «ЛГБТ-пропаганды». Законы вводят запрет на «пропаганду нетрадиционных сексуальных отношений и предпочтений» среди лиц любого пола (предыдущая версия закона запрещала только «ЛГБТ-пропаганду» среди несовершеннолетних), пропаганду педофилии, а также на распространение информации, «демонстрирующей нетрадиционные сексуальные отношения и(или) предпочтения либо способной вызвать у несовершеннолетних желание сменить пол». За нарушения для юрлиц предусмотрены штрафы до 5 млн рублей либо остановка деятельности на срок до 90 суток. 

Формулировки закона максимально широки — в тексте документа не содержится определений того, что именно считается пропагандой или демонстрацией «нетрадиционных сексуальных отношений». В связи с этим российские издатели уже заявили, что из-за юридических рисков, из продажи могут исчезнуть до 50% наименований, включая произведения Виктора Пелевина, биография Чайковского, а также многие книги из школьной программы: «Бесы» Достоевского, рассказы Ивана Бунина, «Тихий Дон» Михаила Шолохова. Кроме того, затраты на выявление ЛГБТ тематики могут составить до 1 млрд рублей. 

Видимо, для снижения издержек, издательства и прибегают к использованию искусственного интеллекта. Директор производства издательства Riderо Мария Рявина сообщила изданию «КоммерсантЪ», что ИИ анализирует текст книг и выделяет те, что содержат упоминания ЛГБТ отношений. Однако параллельно проверку содержания выполняют модераторы, так как издатели признают, что даже после многочисленных тестов, нейросеть не может выявить, есть ли в тексте пропаганда и может отметить даже те книги, где тема негетеросексуальных отношений поднимается вскользь: «Очень сложно просто текстовым анализом сказать, есть в книге пропаганда или нет, не говоря уже о том, что само понятие пропаганды законом не определено», — пояснила Мария Рявина.

Книги, которые ИИ снял с продажи по ошибке, могут быть возвращены в каталог, но только в ручном режиме после обращения автора.

Фактчек в Казахстане и Центральной Азии. Первый центральноазиатский фактчекинговый ресурс. Открыт в мае 2017 года. Член Международной сети фактчекинговых организаций (IFCN)

Factcheck.kz