Команда «ВКонтакте» презентовала создающую заголовки нейросеть

Команда прикладных исследований «ВКонтакте» разработала нейросеть, которая генерирует новостные заголовки на русском и английском языках. Системе нужен только текст публикации: из фрагментов слов алгоритм создаст заголовок с правильными падежами и склонениями. Об этом TJournal сообщает со ссылкой на пресс-службу «ВКонтакте».

Для обучения нейросети использовали новости РИА «Новости» и The New York Times. Технологию представили на Европейской конференции по информационному поиску (European Conference On Information Retrieval 2019), которая прошла в апреле 2019 года в Кёльне.

Разработчики «ВКонтакте» использовали технику компрессии данных Byte Pair Encoding (BPE) и архитектуру Universal Transformer. Технологии применяются в машинном переводе. Команда соцсети — первые, кто использовал BPE для обобщения текста и обучил нейросеть на русскоязычных новостях.

Во «ВКонтакте» пояснили, что результаты работы подобных нейросетей оценивают через совпадения с оригинальным заголовком. В некоторых случаях алгоритм разработчиков показал себя лучше существующих решений. Однако подобный метод оценки не позволил корректно оценить случаи, когда заголовок передаёт суть, но полностью отличается от оригинала.

Для этого разработчики опросили добровольцев, показав им два заголовка. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинала, а в 15% — лучше.

«Использоваться технология может для самых разных задач, связанных с удобством потребления контента — например, во «ВКонтакте» её потенциально можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов», — рассказал разработчик-исследователь «ВКонтакте» Даниил Гаврилов

Он добавил, что нейросеть пока не всегда работает лучше человека. Несмотря на это, разработчики уверены, что добьются равных результатов.