Post content
✔️OpenAI откладывает IPO. Финансовый директор OpenAI Сара Фрайар сообщила, что выход на IPO «не стоит на повестке дня». Приоритеты компании - инвестиции в исследования и рост, а не скорая прибыльность. Масштаб этих инвестиций беспрецедентен: в ближайшие годы OpenAI планирует потратить около $600 млрд. на вычислительные мощности от Oracle, Microsoft и Amazon. На фоне таких расходов OpenAI остается убыточной, хотя и показывает быстрый рост выручки, которая в 2025, по прогнозам, достигнет $13 млрд. Компания даже надеется на помощь правительства США в финансировании закупок чипов. Фрайар подчеркнула, что доля корпоративных клиентов в выручке выросла с 30% до 40% с начала года. Однако прибыльности мешает необходимость субсидировать вычислительные затраты для бесплатных пользователей ChatGPT. wsj.com ✔️NVIDIA запустила микросервис OpenFold3 для биомолекулярных исследований. Консорциум OpenFold при поддержке NVIDIA представили готовый к развертыванию микросервис OpenFold3 NIM для высокоточного прогнозирования трехмерных белковых структур. Инструмент позволяет моделировать взаимодействия белков, ДНК, РНК и малых молекул, что является ключевой задачей в современной фармацевтике и структурной биологии. Сервис основан на открытой модели OpenFold3, упакован в формат NIM и оптимизирован для работы на GPU NVIDIA с использованием технологий Triton Inference Server и TensorRT. Кроме того, совместимость с NVIDIA FLARE позволяет проводить федеративное и совместное обучение модели без необходимости обмена конфиденциальными данными. developer.nvidia.com ✔️Perplexity создала технологию для запуска триллионных ИИ-моделей на AWS EFA. Компания опубликовала свою первую научную работу, которая делает возможным запуск моделей с триллионом параметров без использования специализированных GPU-кластеров. Проблема заключалась в том, что сетевой адаптер AWS EFA не поддерживает технологию GPUDirect Async, которая необходима для быстрой прямой связи между GPU на разных серверах. Инженеры Perplexity создали кастомные ядра параллелизма, которые используют CPU для координации обмена данными между GPU, упаковывая токены для передачи через RDMA и совмещая вычисления с передачей данных. Это решение делает AWS EFA полноценной платформой для инференса массивных MoE-моделей. Тесты показали, что производительность на нескольких узлах AWS не уступает работе на одном кластерном GPU-узле, что позволяет развернуть DeepSeek V3 и Kimi K2. research.perplexity.ai ✔️ComfyUI запустил бета-версию облачного сервиса. ComfyUI открыла публичное бета-тестирование платформы Comfy Cloud. Сервис предоставляет полный доступ к нодовому интерфейсу для генеративных моделей в браузере. Платформа работает на GPU NVIDIA A100 с 40 ГБ видеопамяти. Подписчикам сразу доступны более 400 готовых open-source моделей и 17 популярных расширений. На время бета-тестирования стоимость составляет $20 в месяц. В эту цену включены кредиты на $10 для доступа к партнерским узлам (Sora, Veo) и до 8 часов использования GPU в сутки. Впрочем, есть и ограничения: не более 30 минут на запуск одного форкфлоу и только одна задача в очереди на выполнение. В планах - загрузка собственных моделей и LoRA, развертывание воркфлоу в виде API и инструменты для командной работы. blog.comfy.org ✔️Суд встал на сторону Stability AI в иске о пиратстве. Высокий суд Лондона отклонил основной иск Getty Images против Stability AI, создав важный прецедент для индустрии генеративного ИИ. Getty утверждала, что модель Stable Diffusion сама по себе является «пиратской копией», так как ее веса были созданы на основе защищенных авторским правом изображений. Суд постановил, что модель не является «пиратской копией» по британскому законодательству, поскольку она не хранит и не воспроизводит исходные работы. Это решение - значительная победа для разработчиков ИИ, так как оно снижает юридические риски, связанные с обучением моделей. reuters.com @ai_machinelearning_big_data #news#ai#ml