TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват355,600Просмотры последних постов
Последние посты

Последние посты

Стр. 80 из 85 · 1,009 постов

Опубликован 16 июл.

✔️AMD вслед за Nvidia возобновляет поставки ИИ-чипов в Китай. AMD подтвердила, что планирует возобновить поставки ускорителей MI308 в Китай. Новость последовала всего через несколько часов после аналогичного объявления от Nvidia о разрешении на продажу чипов H20. Министерство торговли США уведомило AMD, что ее заявки на экспортные лицензии будут рассмотрены с высокой вероятностью одобрения. Это событие - серьезный сдвиг в политике Вашингтона, который ранее ввел жесткие ограничения на экспорт ИИ-чипов. Запреты нанесли значительный финансовый ущерб американским компаниям, AMD оценивала свои потенциальные потери в 800 миллионов долларов. Отмена ограничений последовала за критикой со стороны лидеров индустрии, которые утверждали, что подобные запреты неэффективны и лишь стимулируют Китай к созданию собственных технологий, ослабляя глобальное лидерство США в сфере ИИ. tomshardware.com ✔️AWS открыла ранний доступ к кодинг-ассистенту Kiro. Amazon запустил превью Kiro - IDE на основе ИИ. В отличие от простых ассистентов для вайб-кодинга, Kiro позиционируется как инструмент для полного цикла разработки: от концепции до вывода в продакшен. Ключевыми особенностями стали модули Specs и Hooks. Specs преобразовывают общие запросы в структурированные техзадания, пользовательские истории, диаграммы и схемы API, которые остаются синхронизированными с кодом. Hooks - это агенты, работающие в фоне: они могут обновлять тесты при сохранении компонента или проверять код на безопасность перед коммитом. Kiro построена на базе Code OSS и совместима настройками и плагинами VS Code. В режиме отрытого превью среда использует модели от Anthropic. Продукт доступен в трех тарифах: Free, Pro и Pro+. kiro.dev ✔️Anthropic представила платформу для финансового анализа на базе Claude. Anthropic запустила комплексное решение для анализа рынков и принятия инвестиционных решений. Платформа объединяет различные источники данных: от рыночных котировок до внутренних баз на платформах Databricks и Snowflake в едином интерфейсе. В основе лежит семейство моделей Claude 4, которые, по заявлению компании, показывают высокие результаты в финансовых задачах. Платформа глубоко интегрирована с ведущими поставщиками данных: S&P Global, FactSet, PitchBook и Snowflake. Для внедрения в корпоративную среду привлечены консультанты из Deloitte, KPMG и PwC. Платформа уже доступна на AWS Marketplace, а в будущем появится и в Google Cloud. anthropic.com ✔️В NotebookLM появился новый функционал. Google расширила возможности NotebookLM, добавив в него курируемую библиотеку публичных блокнотов. В ней представлен контент от крупных изданий, исследователей, авторов и некоммерческих организаций. Пользователи могут читать оригинальные тексты, задавать по ним вопросы и получать саммари со ссылками на первоисточники. Обновление также принесло новые функции: автоматически сгенерированные аудиообзоры и майнд-карты для быстрой навигации по теме. Среди первых доступных материалов: советы по долголетию, путеводитель по Йеллоустону, произведения Шекспира и финансовая отчетность крупных компаний. blog.google ✔️Мира Мурати анонсировала свой первый продукт. Thinking Machines Lab, который привлек 2 млрд. долларов от фонда a16z, представит свой первый продукт в ближайшие пару месяцев. Он будет мультимодальным, содержать значительный компонент открытого кода и предназначен для исследователей и стартапов, разрабатывающих свои собственные модели. Mira Murati в сети Х @ai_machinelearning_big_data #news#ai#ml

26,400 views

Hashtags

Опубликован 15 июл.

🗣️Voxtral: возвращение голоса как интерфейса Голос был первым пользовательским интерфейсом — задолго до письма или клавиатуры. Сегодня, когда технологии всё ближе к человеку, он снова становится ключевым способом взаимодействия. Но существующие голосовые решения либо закрыты и дорогие, либо недостаточно точны и гибки. Команда Voxtral представила открытые модели понимания речи, призванные закрыть этот разрыв. 🧠Что такое Voxtral: • Две модели: 24B (для продакшена) и 3B (для локальных и edge-сценариев) • Открытая лицензия Apache 2.0 • Доступ через API и оптимизированный endpoint для транскрипции • Разработка на основе Mistral Small 3.1 📌Возможности моделей: • Распознавание аудио до 30–40 минут (32k токенов контекста) • Встроенные вопросы и ответы, суммирование, мультиязычность • Автоматический вызов функций из голоса — API, скрипты, бэкенды • Высокая точность понимания текста и смысла • Поддержка языков: английский, испанский, французский, немецкий, хинди, итальянский, португальский и др. 🧩Идеально подходит для: - Голосовых ассистентов - Поддержки клиентов - Звонков и интервью - Автоматизации рабочих процессов по голосу 🔗https://voxtral.ai @ai_machinelearning_big_data #ml#ai#voxtral#mistral

25,800 views

Опубликован 15 июл.

📌 EXAONE 4.0 — новая LLM от LG, уверенно конкурирующая с топами LG AI Research представила EXAONE 4.0 , свою ризонинг-модель (предыдущие версии). Разработчики называют ее «гибридным ИИ», и это не просто маркетинговый ход. По сути, это сплав классических языковых способностей с мощным механизмом логических рассуждений, унаследованным от предшественника EXAONE Deep. Главная фишка — пошаговый подход к решению задач, основанный на выстраивании цепочки мыслей. Это позволяет модели хорошо справляться не только с текстами, но и со сложными областями вроде математики, науки и программирования. В LG решили не размениваться на мелочи и не придумывать собственные удобные бенчмарки, а сразу вышли на глобальную арену. Модель показала себя более чем достойно на самых сложных и актуальных тестах. Например, на GPQA-Diamond, который проверяет научные знания, она набрала 75.4 балла, а в математическом AIME 2025 — все 85.3. Судя по графикам, EXAONE 4.0 уверенно конкурирует как с открытыми, так и с передовыми закрытыми моделями на английском языке, а также демонстрирует отличные результаты на корейском и недавно добавленном испанском. 🟢На графиках видно: EXAONE 4.0 уверенно конкурирует с передовыми закрытыми и открытыми LLM на английском, а также остаётся одной из лучших на корейском рынке. 🟢 Модель вышла в двух вариантах: 1. EXAONE 4.0 Professional (32B параметров) — заточена под медицину, право и другие сложные предметные области. Уже сдала 6 национальных сертификационных экзаменов в Корее. 2. EXAONE 4.0 On‑Device (1.2B параметров) — работает офлайн прямо на устройстве. При этом она вдвое компактнее, но быстрее предыдущей версии. Идеально для задач с требованиями к приватности и скорости отклика. Еще: - Обучена на 14T токенах. - Поддерживает Model Context Protocol (MCP) - Поддерживает Function Calling — интеграция с внешними инструментами и API прямо через LLM. 📌 многозначная, высокая точность, локальная — всё это делает EXAONE одним из самых интересных релизов, в общем словом - топовая моделька. 🟠Подробнее: https://www.lgresearch.ai/blog/view?seq=576 🟠Model: https://huggingface.co/LGAI-EXAONE/EXAONE-4.0-32B @ai_machinelearning_big_data #AI#ML#LLM#EXAONE#LG

25,500 views

Опубликован 15 июл.

🤔 Хммм… интересно, почему же Grok снова на первом месте в апсторе в Японии?) Grok Anime-Waifu: новый Ghibli-хайп? Аниме-вайфу от Grok сейчас переживает тот же всплеск интереса, что и Ghibli‑стиль после выхода инструмента генерации изображений от ChatGPT🎌 xAI поймали незанятую нишу: 3D-аватары с крутым голосовым режимом и небольшой провокацией. Как бы вы ни относились к этой теме — массовый рынок тут есть, и он пока был пуст. CharacterAI всё ещё в топ‑10 самых посещаемых AI-приложений в мире. Молодёжь массово проводит там часы в общении с вымышленными персонажами. Это о многом говорит — но мы не будем давать оценок деградация это или нет. Важно другое: ни Google, ни OpenAI, ни Microsoft пока не вышли с 3D-аватарами с продвинутым голосовым режимом. Все знали, что это огромный рынок, но опасались репутационных последствий — вспомните скандалы вокруг CharacterAI в прошлом году. А xAI рискнули — и пока пожимают плоды . Аудитория молодая, хайп органический, конкуренты только приглядываются к теме. Быть первым в такой категории — значит занять особое место в головах (пустых и не очень) пользователей. Так что да: xAI сделали ставку — и, похоже, угадали. @data_analysis_ml

18,000 views

Опубликован 15 июл.

🌟MUVERA: уравниваем в скорости многовекторный и одновекторный поиск. MUVERA - алгоритм, разработанный Google Research, который сводит сложную задачу многовекторного поиска обратно к простому и быстрому MIPS, как в подходах с одним вектором. Суть проста: вместо того чтобы работать с громоздким набором векторов, MUVERA сжимает его в единый вектор фиксированной длины, так называемый Fixed Dimensional Encoding (FDE). Главный трюк в том, что скалярное произведение этих новых FDE-векторов очень точно аппроксимирует исходную, «честную» метрику Чамфера. На практике процесс выглядит как двухэтапный конвейер. Сначала MUVERA генерирует FDE для всех документов в базе и индексирует их с помощью обычного MIPS-солвера. Когда приходит запрос, для него тоже создается FDE, и система молниеносно находит небольшой список кандидатов. А уже затем этот короткий список переранжируется с использованием оригинальной, медленной, но точной метрики Чамфера. На выходе получаем и скорость, и качество. В практическом сравнении с предыдущим SOTA методом PLAID, MUVERA показывает в среднем на 10% более высокую полноту выдачи при сокращении задержки на 90%. Чтобы достичь того же качества, алгоритму требуется отобрать в 5-20 раз меньше кандидатов для финального переранжирования. Более того, эти FDE-векторы отлично сжимаются — до 32 раз с минимальной потерей качества. Для тех. кто хочет попробовать, в репозитории проекта на Github есть реализации MUVERA на Python и C++ . 📌Лицензирование: Apache 2.0 🟡Статья 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#LLM#MUVERA#GoogleResearch

24,200 views

Опубликован 15 июл.

✔️Эмбеддинг-модель Gemini от Google стала общедоступной. Google объявила о выходе в общий доступ модели для создания текстовых эмбеддингов - Gemini-Embedding-001. Она доступна разработчикам через Gemini API и Vertex AI. С момента своего экспериментального запуска модель стабильно занимает лидирующие позиции в бенчмарке MTEB и поддерживает более 100 языков. Gemini Embedding использует технику Matryoshka Representation Learning. Она позволяет разработчикам гибко настраивать размерность выходных векторов, чтобы оптимизировать производительность и затраты на хранение. Максимальная длина входных данных составляет 2048 токенов. Стоимость использования модели : $0.15 за 1 миллион входных токенов. Доступ к ней можно получить через Gemini API, а бесплатно протестировать - в Google AI Studio. developers.googleblog.com ✔️Лаборатория суперинтеллекта в компании Марка Цукерберга обсуждает отказ от open-source. Недавно созданное подразделение по разработке AGI инициировало дискуссию о кардинальном изменении стратегии компании. Ключевая идея - отказаться от развития флагманской open-source модели Behemoth в пользу закрытой архитектуры, по аналогии с OpenAI и Google. Такой шаг стал бы серьезным философским сдвигом для компании, которая годами продвигала открытый код и завоевала признание разработчиков. Обсуждения пока находятся на ранней стадии и требуют одобрения Марка Цукерберга. Однако сама дискуссия, начатая новой командой под руководством Александра Ванга, указывает на возможный стратегический разворот гиганта соцсетей. nytimes.com ✔️В Grok появились анимированные 3D-персонажи. xAI начала развертывание новой функции «Companions» для чат-бота Grok в приложении для iOS. Обновление добавляет в интерфейс интерактивных трехмерных персонажей, цель которых - сделать общение более персонализированным и выйти за рамки текстовых ответов. На данный момент функция доступна платным подписчикам SuperGrok. Пользователи могут выбрать одного из двух анимированных аватаров: аниме-девушку Ani или красную панду Bad Rudy. Включить их можно в меню настроек. В компании обещают позже добавить третьего персонажа. Elon Mask в сети Х ✔️Топовые немецкие ученые в области Med AI переехали работать в Китай. Два выдающихся специалиста из Германии, Роланд Эйльс и Ирина Леманн, присоединились к Университету Фудань в Шанхае. Их работа была ключевой в создании атласа клеток поджелудочной железы человека и использовании ИИ для прогнозирования рисков заболеваний. Эйльс - всемирно известный математик и биолог, руководивший крупными национальными исследовательскими проектами. Леманн - профессор в области эпигенетики, возглавлявшая несколько международных научных конференций. Супруги опубликовали более 1000 научных работ и имеют свыше 100 000 цитирований. В Университете Фудань они присоединились к Институту интеллектуальной медицины и планируют создать совместную немецко-китайскую ИИ-лабораторию. scmp.com ✔️Perplexity будет дообучать модели Kimi. Глава Perplexity Аравинд Шринивас рассказал о планах компании начать пост-тренинг моделей Kimi от Moonshot AI. Решение было принято после внутренних тестов, которые показали, что потенциал Kimi сопоставим с GPT-4 и Claude. Решающим фактором стало превосходство Kimi K2 в бенчмарках на программирование. В частности, в тесте SWE-bench Verified она показала результат 65.8%, значительно опередив Claude с его 50.2%. В Perplexity рассчитывают, что дальнейшее дообучение модели усилит ее агентные возможности. CEO Perplexity сети X @ai_machinelearning_big_data #news#ai#ml

26,100 views

Hashtags

Опубликован 14 июл.

🧠 Как «вклеить» объект в картинку так, чтобы он выглядел естественно? Это одна из самых сложных задач в семантической генерации: 🔸 нужно сохранить структуру сцены 🔸 вставить объект по текстовому описанию 🔸 и найти уместное место, а не просто налепить поверх Большинство моделей с этим не справляются — объект добавляется не к месту или портит фон. Новый метод Add-it от NVIDIA решает эту задачу без обучения модели. Он расширяет механизм внимания в диффузионных моделях, чтобы учитывать сразу три источника: 1. Оригинальное изображение 2. Текстовый промпт 3. Промежуточную сгенерированную картинку 📌 Такой подход позволяет: – сохранить геометрию сцены – встроить объект туда, где он действительно мог бы быть – не терять мелкие детали и текстуры 📊 Результаты: – Add-it без дообучения обходит supervised‑модели – На новом бенчмарке Additing Affordance показывает SOTA результат по «естественности размещения» – В слепых тестах люди выбирают его в 80% случаев – Улучшает метрики качества генерации 🟠Github: https://github.com/NVlabs/addit 🟠Demo: https://huggingface.co/spaces/nvidia/addit 🟠Paper: https://arxiv.org/abs/2411.07232 🟠Project: https://research.nvidia.com/labs/par/addit/ @ai_machinelearning_big_data #NVIDIA#Diffusion#Addit#StableDiffusion#AIgen#ControllableGeneration

38,000 views

Опубликован 14 июл.

✔️Turbo ML Conf 2025 от Т-Технологий — материнской компании Т-Банка — пройдет в России во второй раз. В этом году конфа для AI и ML- разработчиков пройдет в кластере “Ломоносов” 19 июля. В программе предусмотрено 5 блоков: NLP, CV & Speech, RecSys, Research…

38,900 views

Опубликован 14 июл.

🛠 Вышел новый генератор CAD‑моделей по чертежам — и он реально работает! GenCAD умеет превращать чертежи в 3D‑модели и сразу генерирует параметрический CAD‑код. Для сложных и детализированных объектов он пока не подойдет, но с простыми деталями вроде винтиков и креплений справляется отлично. 📎 Идеально для быстрого прототипирования стандартных элементов. 📄 Статья: https://openreview.net/pdf?id=e817c1wEZ6 🔗 Сайт: https://gencad.github.io 💻 Код: https://github.com/ferdous-alam/GenCAD @pythonl - погружение в Python

33,300 views

Опубликован 14 июл.

🔥 Сейчас проходит ICML 2025 — одна из главных конференций по машинному обучению. Команда AI VK всю неделю делится обзорами самых интересных работ. 📌 Сегодня в центре внимания — трансформерная архитектура нового поколения: быстрая, простая и без softmax. Авторы статьи *“MatMuls are Enough”* предлагают кардинально упрощённую модель, в которой механизм внимания сводится к чистым матричным перемножениям без нелинейностей, dropout и маскировок. 🔧 В архитектуре: ▪️ Удалён softmax — вообще ничего не добавлено взамен ▪️ Вместо нескольких голов внимания — одна большая ▪️ Упрощены нормализации и убраны residual-соединения ▪️ Всё написано на чистом PyTorch, без CUDA-оптимизаций 📈 Результат — линейная сложность по длине текста, отличная переносимость между устройствами и SOTA на GLUE и Long Range Arena. Честно говоря, очень достойный претендент на главную инженерную идею ICML. @ai_machinelearning_big_data

35,000 views

Опубликован 14 июл.

🔅Elon Musk винит "плохие данные" за провалы Grok. Но это не вся правда Elon Musk заявил, что проблемы Grok (например когда модель считала себя Гитлером) связаны с "плохими обучающими данными", и пообещал, что в версии v7 всё будет исправлено, потому что они "очистят датасет". ▶️ Звучит просто. Но если всё дело в данных — зачем тогда продолжают выпускать Grok-4, зная, что он обучен на том же грязном корпусе? Это больше похоже на попытку перевести фокус с реальных проблем, которые глубже и серьёзнее: – Выравнивание (alignment) становится всё сложнее – Проблемы не только в данных, а в самой архитектуре, управлении памятью, RLHF и недостаточной прозрачности модели – “Плохие данные” — это симптом, а не корень проблемы Возможно, Grok просто не справляется с масштабом данных, и это не фиксятся «переобучением на v7». 📌 Мы всё ещё в той точке, где модели растут быстрее, чем понимание того, как их контролировать. @ai_machinelearning_big_data #elonmusk#grok

33,400 views

Опубликован 14 июл.

🖥Дженсен Хуанг: США должны продавать чипы даже Китаю — это усилит наше лидерство в AI Глава NVIDIA объяснил, почему экспорт AI-чипов — это не слабость, а стратегия: 🗣 «Половина AI-разработчиков в мире — китайцы. Пусть они строят свои системы на нашей технологии.» 💡 Что он имеет в виду: — Если весь мир (включая Китай) работает на американских чипах, платформах и фреймворках, — США получают техническое и инфраструктурное преимущество, — А значит — долгосрочное лидерство в AI, даже если некоторые страны развивают собственные модели. 🔍 А как же риски? Военные, шпионские? > «Они не будут строить военные системы на чужих чипах. Просто не могут себе это позволить.» Технологии, от которых зависит твой конкурент— это не оружие. Это рычаг влияния. И чем больше стран завязаны на американском стеке — тем выше шансы, что США останутся в центре мировой AI-инфраструктуры. Еще из интересного, после того как MIT выпустили исследование о том, что ИИ якобы снижает когнитивные способности человека, Хуанг в своём стиле — дал "жесткий" ответ: > “Я не читал это исследование, лол” > “Я каждый день пользуюсь ИИ — и мои когнитивные навыки только растут” ▪Критическое мышление никто не отменял > “Я не принимаю ответ как есть — я его анализирую, критикую, уточняю” > “Такой подход и развивает мышлени • Полное интервью Дженсена @ai_machinelearning_big_data #ai#Ml#nvidia

31,000 views
12•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••65•••70•••75•••7879808182•••8485