Нейросеть от Open Ai редактирует изображения по текстовому описанию

Исследователи компании OpenAI создали нейросеть, способную редактировать изображения по словесному описанию желаемого результата. Об этом говорится в обзоре ZME Science. Авторы издания пишут, что способности нейросети CLIP даже устрашают, учитывая потенциальную возможность создавать с её помощью дипфейки.

Специалисты OpenAI обучили нейросеть обусловленности текстового описания и изображения на 3,5 миллиардах параметров. 

Работает GLIDE так: после введения текстового описания нейросеть ищет существующее изображение, а затем редактирует его. Правки соответствуют стилю и освещению окружающего контента, поэтому результат выглядит как плоды редактирования некоего автоматизированного Photoshop.

Нейросеть от Open Ai редактирует изображения по текстовому описанию
© изображение с сайта zmescience.com

В обзоре сообщается, что пока GLIDE не идеален. Например, некоторые запросы, описывающие весьма необычные объекты или сценарии, например описание «автомобиля с треугольными колесами», не дают изображений с удовлетворительными результатами. 

Контекст 

  • Весной этого года стало известно, что нейросеть научили создавать поразительно правдоподобные изображения несуществующих котов. Изображения публикуются на сайте This Cat Does Not Exist. 

Журналист, медиакритик, фотограф. Работал на ТВ (телеканалы «Алматы», Astana, КТК, 7 канал), в печатных и мультимедийных интернет-изданиях, сотрудничал с проектом «Радиоточка» до его закрытия в 2017 году, занимался медиакритикой в издании «Новый репортёр».

Factcheck.kz