Содержимое
📩 Состоялся запуск OpenEuroLLM - инициативы ЕС по разработке линейки больших языковых моделей с целью качественной работы на всех 24 официальных языках стран-участниц, а также нескольких стратегически важных. Среди заявленных приоритетов: открытость кода и данных (в рамках лицензий и законов), универсальность для широкого круга потребителей, а также стремление к цифровому суверенитету Евросоюза. Проект реализуется совместно силами более 20 организаций - университетов и частных лабораторий ИИ - с использованием вычислительной инфраструктуры EuroHPC и датасетов HPLT/Common Crawl. Первый релиз запланирован на середину следующего года, а завершение - на 2028. 📌 Комментарий экспертов Центра ИИ МГИМО: - Интересно, что в стремлении к европейской независимости (а, быть может, из-за бюрократических ограничений при выделении финансирования) исключается участие организаций вне ЕС, в т.ч. британских и швейцарских. - Даже если предположить безлимитные вычислительные ресурсы, выстраивание эффективных процессов с участием десятков и сотен специалистов из 6+ стран - задача не из простых. - Между европейскими языками нет равенства, как минимум по наличию данных для обучения. Требуется также создание универсальных бенчмарков на самых ранних этапах. - Аналогичный проект EuroLLM в сотрудничестве с разработчиками и учеными из Соединенного Королевства, уже показал первые, пускай и скромные, результаты.