OpenAI анонсировала новую флагманскую модель генеративного искусственного интеллекта под названием GPT-4o — буква «o» означает «omni» (с англ. «всесторонний» — ред.). Этим подразумевается способность модели обрабатывать текст, устную речь и видео, сообщает TechCrunch.
Технический директор OpenAI Мира Мурати заявила, что GPT-4o обеспечивает интеллект «уровня GPT-4», но улучшает возможности GPT-4 в различных сферах.
Если GPT-4 Turbo, предыдущая «самая продвинутая» модель OpenAI, обучалась на изображениях и текстах, и, соответственно, умеет их анализировать, то GPT-4o, как уже было сказано, обучали распознавать устную речь. По словам представителей OpenAI, модель обеспечивает реагирование «в реальном времени» и может даже улавливать нюансы голоса пользователя, генерируя в ответ речь «в различных эмоциональных стилях», включая пение. GPT-4o, по заверениям производителей, владеет 50 языками.
Контекст
- Не так давно OpenAI представила Sora, генеративную модель искусственного интеллекта, которая создает видео из текстового описания.