TGTGInsightаналитика telegramLIVE / telegram public index
← AI Global Agenda
AI Global Agenda avatar

TGINSIGHT POST

Post #1409

@aicentremgimo

AI Global Agenda

Просмотры929Количество просмотров
Опубликован10 июл.10.07.2025, 14:51
Содержимое поста

Содержимое

📩 Исследовательский нон-профит EleutherAI объявил о релизе 8-терабайтного открытого датасета Common Pile v0.1, который, как утверждается, не содержит нелицензированного copyrighted контента. Сбор и сортировка данных производились, в том числе, силами партнеров из академического сообщества. Известно, что предыдущие версии Common Pile использовались для обучения открытых моделей по всему миру, включая отечественную YaLM 100B. 📌 Комментарий экспертов Центра ИИ МГИМО EleutherAI противопоставляет себя типичным игрокам рынка ИИ, полагаясь на усилия энтузиастов и идеалы открытого софта и общедоступности знаний. При этом результатом их работы являются не коммерческие продукты, а датасеты, open source ИИ-модели и научные публикации. Работа оплачиваемых сотрудников и вычислительные ресурсы обеспечены пожертвованиями широкого круга лиц и компаний, среди которых Google, Hugging Face и Stability AI. Ключевым посылом релиза Common Pile стал тезис, что для обучения конкурентных моделей необязательно прибегать к практикам веб-скрейпинга и откровенного пиратства контента, распространенных на текущем этапе развития индустрии ИИ.