Содержимое
⚡️Microsoft начала внедрение ускорителя Maia 200. Microsoft выкатывает 2 поколение собственного ИИ-чипа Maia, который должен снизить зависимость от Nvidia и оптимизировать расходы на инфраструктуру. Ускорители уже поступают в дата-центры MS в США, а разработчикам открыли доступ к SDK, хотя сроки публичного запуска инстансов в Azure пока не названы. Maia 200 — это решение на 3-нм техпроцессе, содержащее более 140 млрд. транзисторов. Архитектура специально заточена под инференс: заявлена производительность свыше 10 петафлопс в точности FP4 и 5 петафлопс в FP8. Подсистема памяти включает 216 ГБ HBM3e с пропускной способностью 7 ТБ/с, дополненные 272 МБ сверхбыстрого SRAM-кэша на кристалле. TDP одного чипа составляет 750 Вт. Maia 200 работает в 3 раза быстрее Amazon Trainium 3 и превосходит Google TPU v7 в FP8 (где чип выдает 5 петафлопс). Архитектура оптимизирована под инференс и поддерживает бесшовное масштабирование в кластеры до 6144 ускорителей. Новый чип запредельно эффективен экономически: показатель производительности на доллар у Maia 200 на 30% выше, чем у актуального железа конкурентов. @ai_machinelearning_big_data #news#ai#ml