Машинный фактчекинг, неоднозначный Facebook и зарплата Чудо-женщины

Очередной дайджест factcheck.kz о том, что происходит в мире фактчекинга.

Содержание

Машинное обучение на страже фейков

Fake News Challenge и Knight Foundation подвели итоги конкурсов по борьбе с фейками и дезинформацией – один сделал ставку на искусственный интеллект и машинное обучение, другой помимо современных технологий задействовал традиционные методики.

Fake News Challenge предлагал участникам решить следующую задачу с помощью машинного обучения: нужно было создать программу, которая умела бы сравнивать суть заголовка со смыслом статьи. Многие фейковые новости могут иметь вполне себе достоверные данные в тексте, а заголовок при этом выходит кликбейтный с искаженной информацией.

Создатели конкурса выбрали именно такой ракурс, чтобы в дальнейшем полуавтоматизировать работу журналистов и фактчекеров (машинный фактчекинг, само собой, не заменит полностью ручную проверку). Победителями стали три команды, их проекты выложены в открытом доступе.

Победители конкурса Knight Foundation борются с фейками посредством мультимедиа, интерактивного общения, традиционной журналистики и конечно технологий: Crosscheck от Vanderbilt University и First Draft использует дизайн, чтобы сделать верные новости визуально запоминающимися; мобильная игра в рамках проекта Facts Matter от PolitiFact построена на распространённых заблуждениях по отдельным темам; Immigration Lab от Univision News призван помочь мигрантам, облегчить им доступ к информации, а также изучить то, как они потребляют медиа; News Quality Score Project с помощью машинного обучения оценивает статьи на основе предыдущих работ авторов, анализа структуры текста и других компонентов.

Машинное обучение теперь будет использовать и NY Times для модерации комментариев. Приложение Perspective с помощью алгоритмов определяет токсичность комментариев, тем самым разгрузит работу модераторов и редакторов. Возможность комментариев на данный момент есть у 10% статей, благодаря приложению это количество хотят увеличить до 80%. Остальные 20% материалов NY Times останутся недоступными для комментирования: это в частности касается «горящих» новостей и некрологов отдельным персонам во избежание распространения неверных слухов, насмешек и оскорблений.

Напомним, ранее мы писали о фактчекингововых инициативах Google и “Википедии”

Предвыборные гонки в британском интернете

В Великобритании подводят итоги того, как СМИ и интернет освещали предвыборные кампании. First Draft проанализировал итоги и вывел 5 типичных примеров фейков:

Заголовки, вводящие в заблуждение, большей частью попадались в популярных изданиях. К примеру, Telegraph опубликовал статью под названием «Labour election campaign boosted by bots» («Лейбористы используют ботов для избирательных кампаний»). В статье упоминается доклад Оксфордского университета, который анализировал твиты политических партий. Так было найдено 21 000 автоматических сообщений, поддерживающих лейбористов, и 13 000 – консерваторов. Однако в статье про последних было сказано мимоходом.
Преувеличение и дезинформация от гипер-партизанских сайтов – тех, что публикуют только положительные статьи о выбранной ими политической позиции и порой получают охват больший, чем официальные издания. Например, сайт Evolve Politics преувеличил обещание консерваторов в заголовке «Theresa May’s Tory manifesto scraps the ban on elephant ivory sales after bowing to millionaire antique lobbyists» («Тереза Мэй преклоняется перед лоббистами-антикварами и пересматривает запрет на продажу слоновой кости»), хотя тори до сих пор считают необходимым запрет на подобную торговлю.
Гипер-партизанские сайты атакуют традиционные медиа. Так CNN обвинили в создании постановочных видео с антитеррористической мусульманской демонстрацией, которое получило широкое распространение в Twitter и Facebook. В действительности автором видео является пользователь @markantro.
Официальные политические партии также искажают факты. В частности лейбористская партия распространяла следующие цифры о сокращении полицейских в стране: 4650 было уволено в 2011 году, 9655 в 2012, 17125 в 2015, 20000 в 2017. На самом деле эти цифры кумулятивные, т.е. цифра за 2017 год содержит цифры за предыдущие годы, а не только за один 2017.
Ложные слухи, получившие быстрое распространение. Например, на Facebook был популярным пост с заголовком якобы BBC о том, что выборы будут идти два дня из-за небывалого количества избирателей.

«Чудо-женщина» и фактчекинг голивудских зарплат

Интернет на днях возмущался очередным случаем дискриминации женщин: Галь Гадот, исполнившая главную роль в блокбастере «Чудо-женщина», получила 300 тысяч долларов, в то время как Генри Кавилл за роль Супермена в «Человеке из стали» аж 14 млн долларов. Новости про гендерный разрыв в голливудских зарплатах не утихают с утечки писем Sony в 2014 году.

Однако, как выяснилось, источники информации этой новости оказались сомнительными. Гонорар Гадот, упомянутый в статье журнала Elle, был взят из журнала Variety, который ссылается на израильское развлекательное шоу. Что касается зарплаты Генри Кавилла, то история обстоит еще более туманно: Elle указывает Forbes в качестве источника, он в свою очередь ссылается на сайт The Richest, якобы оценивающий «стоимость» селебритис (celebrity’s net worth). Расчёт на нём построен только на двух цифрах за 2013 год в отношении Кавилла: 14 млн долларов, полученные им от «Человека из стали», включая бонусы от мирового проката, и 23 900 долларов от рекламы наручных часов Omega De Ville Hour Vision. Гонорары Кавилла, вырученные им от предыдущих или последующих картин или каких-либо дополнительных заработков, не упомянуты.

Меж тем все голливудские актёры, впервые снимающиеся в фильмах о супергероях, получают приблизительно одни и те же суммы, особенно если это касается не слишком раскрученных звёзд. Крис Эванс за «Первый мститель» заработал столько же, сколько Гадот – 300 тысяч долларов, Крис Хемсворт за главную роль в «Торе» – 150 тысяч долларов, хотя оба фильма были успешны в мировом прокате. За участие в сиквелах актёры уже могут получить на порядок больше.

Неоднозначные правила Facebook

Guardian изучил секретный устав Facebook о том, какой контент блокируется социальной сетью, а какой нет. Hate speech, жестокость, терроризм, порнография, расизм, причинение вреда самому себе – ежедневно редакторы и модераторы должны выносить тысячи решений, на каждое из которых у них есть условно 10 секунд . Самым сложным контентом, считают они, является тот, что связан с сексом. Впрочем, и остальные темы имеют зачастую расплывчатые, запутанные правила.

Так реплики вроде «кто-нибудь убейте Трампа» должны быть удалены, поскольку он глава государства, а значит, находится в группе защищенных лиц. Но фразы типа «съ*бись и умри» или «чтобы задушить, нужно нажать всей силой на середину горла» удалены не будут, потому как не считаются весомой угрозой. Видео насильственных смертей, несмотря на то, что помечаются пользователями как нежелательный контент, могут остаться в сети, поскольку «способствуют осознанию обществом таких проблем как психические заболевания». Также Facebook позволяет пользователям устраивать лайв-трансляции того, как они причиняют себе вред, ссылаясь на то, что они не хотят усиливать стресс этих пользователей, в котором они и так находятся.

Моника Бикерт, глава управления глобальной политики Facebook, говорит, что сложно достичь консенсуса, когда сервисом пользуются 2 млрд человек из разных культур. «У каждого своё представление, чем можно делиться. Вне зависимости от того, где проведёшь границу, останутся «серые» зоны. Например, как найти разницу между юмором, сатирой и неприемлемым контентом?» – добавляет Бикерт.

Facebook использовал в прошлом различные программы для фильтрации визуального контента, однако последнее слово остается на данный момент за людьми. Как заявляет сама компания, «мы хотим, чтобы пользователи обсуждали глобальные и текущие события… поскольку значим в некоторых ситуациях именно контекст».

Как СМИ накручивают рейтинг

«Новая газета» разобралась в устройстве рынка ботов российских СМИ. Боты, надо сказать, эволюционировали: от простых заходов на страницу они научились имитировать человеческое поведение вплоть до микроподёргивания мышкой. Для поднятия рейтинга некоторые СМИ устанавливают у себя на сайте ссылки вроде «Шок! Сегодня скончалась Алла Пугачева», переход на них перекидывает пользователя на сайты из системы партнёрского обмена. Такие сайты зачастую подделываются под серьёзную журналистику или копируют государственные – например, есть фейки сайта Минздрава с «отзывами о лекарствах» и «советами».

Сами обменные сети также закупают трафик ботов, чтобы перенаправить на сайты СМИ. «Серый трафик» может быть нужен медиа в двух целях: чтобы обманывать рекламодателя или чтобы рассказать о своей влиятельности, — считает Антонина Самсонова, CEO и основатель портала TheQuestion. В целом о «сером» рынке, отмечает «Новая газета», медиа-эксперты говорят неохотно.