Нейросеть от Open Ai редактирует изображения по текстовому описанию

Исследователи компании OpenAI создали нейросеть, способную редактировать изображения по словесному описанию желаемого результата. Об этом говорится в обзоре ZME Science. Авторы издания пишут, что способности нейросети CLIP даже устрашают, учитывая потенциальную возможность создавать с её помощью дипфейки.

Специалисты OpenAI обучили нейросеть обусловленности текстового описания и изображения на 3,5 миллиардах параметров. 

Работает GLIDE так: после введения текстового описания нейросеть ищет существующее изображение, а затем редактирует его. Правки соответствуют стилю и освещению окружающего контента, поэтому результат выглядит как плоды редактирования некоего автоматизированного Photoshop.

© изображение с сайта zmescience.com

В обзоре сообщается, что пока GLIDE не идеален. Например, некоторые запросы, описывающие весьма необычные объекты или сценарии, например описание «автомобиля с треугольными колесами», не дают изображений с удовлетворительными результатами. 

Контекст 

  • Весной этого года стало известно, что нейросеть научили создавать поразительно правдоподобные изображения несуществующих котов. Изображения публикуются на сайте This Cat Does Not Exist. 
Внесите свой вклад в борьбу с дезинформацией!
Сергей Ким
Журналист, медиакритик, фотограф. Работал на телевидении и радио, сотрудничал с проектом «Радиоточка» до его закрытия в 2017 году. Возглавлял алматинскую редакцию проекта «Спутник-Казахстан», ведёт колонку медиакритики для проекта NewReporter.org