Разработчики из Швейцарии представили сразу две большие языковые модели (LLM) с открытым исходным кодом. Интересная особенность – их разработали с помощью суперкомпьютера, сообщает The Register.
Специалисты из Швейцарской высшей технической школы Цюриха и Федеральной политехнической школы в Лозанне на Международном саммите разработчиков программ с открытым исходным кодом в Женеве представили LLM, обученные на национальном суперкомпьютере Alps.
Alps является третьим по мощности суперкомпьютером в Европе и восьмым в мире. Также это один из первых суперкомпьютеров, созданных на базе инновационных чипов Grace-Hopper от Nvidia (всего их здесь более 10 тысяч).
Особое внимание авторы проекта уделяют полной открытости – этим швейцарские LLM отличаются от детищ технологических гигантов Microsoft, Google и Meta. Кроме кода в открытом доступе будут все данные, на которых эти модели обучались.
Один из авторов проекта, профессор Мартин Ягги, утверждает, что раскрытие данных должно стимулировать развитие инноваций как в Европе, так и в рамках международных проектов.
Презентованные LLM окажутся в открытом доступе уже летом, а распространяться будут по свободной лицензии Apache 2.0.
Контекст
- Недавно китайский ИИ-сервис DeepSeek стал настоящей сенсацией, и причин тому несколько. Вопреки названию, американская компания OpenAI хранит в секрете принцип работы ChatGPT, в то время как код китайского конкурента общедоступен. Бюджет DeepSeek это лишь небольшая часть того, что американские создатели ИИ тратят для достижения той же производительности. Успех китайского стартапа заставил инвесторов в Кремниевой долине усомниться в оправданности высокой стоимости акций американских компаний, связанных с ИИ. Сервис из КНР даже стал причиной обвала на бирже