TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват299,700Просмотры последних постов
Последние посты

Последние посты

Стр. 11 из 85 · 1,009 постов

Опубликован 25 мар.

📌Google разработала алгоритм квантования KV-кэша без потери точности. Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом. TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026. KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти. Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие. 🟡TurboQuant - двухэтапный пайплайн. Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны. На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score. Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных". Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral. При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация. Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами. Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data 🎯Полезные Мл-ресурсы🚀Max #AI#ML#LLM#TurboQuant#Google

33,500 views

Опубликован 24 мар.

📱 Claude - вторая по популярности LLM после ChatGPT и уже обгоняет Gemini. Хотя Anthropic изначально делала ставку на корпоративный сегмент, им удалось уверенно выйти и на массовый рынок. Обновления выходят почти каждый день. Anthropic смогли стереть границу между «бизнес-инструментом» и «продуктом для всех». А последние релизы показывают: они не просто догоняют тренды, а начинают их задавать. Пользуетесь ли вы Claude? Какое из последних обновлений зашло больше всего? 👇 @ai_machinelearning_big_data #Claude

25,800 views

Hashtags

Опубликован 24 мар.

🚨 Обнаружено, что релиз LiteLLM на PyPI версии 1.82.8 содержит вредоносный код. Стандартная команда `pip install litellm` могла привести к утечке: SSH-ключей, учётных данных AWS/GCP/Azure, Kubernetes-конфигов, git-доступов, всех API-ключей из переменных окружения, истории команд, SSL-ключей, CI/CD-секретов и паролей к базам данных. И это не нишевая библиотека, у LiteLLM около 97 млн скачиваний в месяц. Даже без прямой установки litellm вредоносный код мог попасть к пользователям через другие пакеты (например, `dspy`). Скомпрометированную версию пакета обнаружили случайно: при установке пакета у разработчика произошёл сбой из-за утечки памяти. Без этого сбоя атака могла оставаться незамеченной долгое время . Supply chain атаки становятся одним из самых серьёзных рисков в современной разработке. Подход «использовать как можно больше готовых библиотек» требует некоторого переосмысления. Andrej Karpathy: https://x.com/karpathy/status/2036488892443140551 1. Первичный разбор (issue на GitHub): https://github.com/BerriAI/litellm/issues/24512 - подробное техническое описание вредоносного кода: что именно крадёт и как работает 2. Официальный issue от BerriAI: https://github.com/BerriAI/litellm/issues/24518 — реакция команды и обновления по ситуации 3. Блог FutureSearch (обнаружили атаку): https://futuresearch.ai/blog/litellm-pypi-supply-chain-attack/ • как баг с fork bomb в вредоносном коде уронил машину и помог выявить атаку 4. Полный таймлайн TeamPCP от ramimac: https://ramimac.me/teampcp/ — вся цепочка атаки: Trivy → Checkmarx → litellm, с точными временными метками и IOC 5. Тред на Hacker News (основной): https://news.ycombinator.com/item?id=47501729 - обсуждение в реальном времени, включая ответы от Krrish (maintainer litellm) 6. Разбор от GitGuardian: https://blog.gitguardian.com/trivys-march-supply-chain-attack-shows-where-secret-exposure-hurts-most/ - анализ того, как утечка CI/CD-секретов запустила всю цепочку атаки @ai_machinelearning_big_data #llm#ml#cybersecurity

33,100 views

Опубликован 24 мар.

⚡️ Сбер выпустил крупнейшее обновление ГигаЧат — и выложил в open source. GigaChat Ultra и GigaChat-3.1-Lightning уже под MIT-лицензией. Текущее обновление дало заметный прирост по качеству ответов, устойчивости генерации и прикладным сценариям использования. Модели можно разворачивать в закрытом контуре, адаптировать под корпоративные данные и использовать как базу для чат-ботов, внутренних ассистентов и отраслевых AI-сервисов. 🟡Что важно в самом обновлении В статье на Хабр команда описывает переход от Dense к MoE, переработку этапа постобучения и отдельную работу над устойчивостью генерации. Один из ключевых результатов — модели значительно реже уходят в циклы, то есть стабильнее ведут себя в длинных ответах и диалогах. В релизных материалах это вынесено как отдельное качественное улучшение. DPO-этап переведён в нативный FP8. Практический смысл этого изменения — более эффективное использование памяти на этапе дообучения без потери качества относительно предыдущих версий. Дополнительно в ходе работы был выявлен критичный баг в SGLang, который влиял на качество и корректность замеров. 🟡По моделям Ultra в этом обновлении заметно усилилась в математике, задачах на рассуждение. Lightning — компактная модель с 1,8 млрд активных параметров, ориентированная на быстрые сценарии. При этом в релизе отдельно отмечен рост качества общения, следования инструкциям и общих знаний. ГигаЧат получил две новые функции: научился искать в интернете прямо во время диалога и научился в запоминать важные факты для пользователя — это называется долгосрочная память. ✔️ Для разработчиков это означает, что open source-релиз принёс не просто открытые веса, а более зрелую и инженерно доработанную базу, на которой можно строить как качественные, так и экономически эффективные решения. Для рынка — это шаг к развитию собственной открытой экосистемы русскоязычных моделей, пригодных для реальных продуктовых внедрений. @ai_machinelearning_big_data #news#ai#ml#llm#opensource

21,100 views

Опубликован 24 мар.

🌟Kimodo: диффузионная модель для генерации 3D-движений людей. NVIDIA выложила в открытый доступ проект Kimodo - генеративную модель на основе диффузии, которая создает реалистичные трехмерные движения для человеческих и робототехнических скелетов. Kimodo принимает на вход текстовые промпты и ключевые позы всего тела, позиции и вращения конечностей, двухмерные пути и контрольные точки. Это позволяет точно управлять генерацией: от общего описания наподобие "персонаж идет и садится на стул" до детального контроля положения рук и ног в кадрах. Всего доступно 5 вариантов модели для 3 типов скелетов: SOMA, SMPL-X и Unitree G1. Первые два ориентированы на анимацию аватаров, третий - на робота Unitree G1. Модели, обученные на полном датасете Bones Rigplay 1 (700 часов), NVIDIA рекомендует как основные рабочие. Варианты на сете BONES-SEED (288 часов) предназначены для бенчмаркинга и сравнения с собственными разработками. Для работы с Kimodo предусмотрены 3 интерфейса: 🟢Интерактивное веб-демо с таймлайн-редактором; 🟢CLI-утилита для пакетной генерации; 🟢Python API для тонкой настройки . Под инференс потребуется около 17 ГБ видеопамяти, модели запускали на RTX 3090, RTX 4090 и NVIDIA A100. 🟡Интеграция с робототехническим стеком NVIDIA. ProtoMotions позволяет брать сгенерированные движения и обучать на них физически корректные политики управления в GPU-ускоренной симуляции — как для аватаров, так и для Unitree G1. Через General Motion Retargeting движения, созданные на скелете SMPL-X, можно перенести на произвольных роботов. 📌Лицензирование: Код проекта под Apache 2.0, большинство моделей под NVIDIA Open Model License. Вариант SMPL-X имеет более ограниченную NVIDIA R&D Model License, она допускает только исследовательское применение. 🟡Набор моделей 🟡Техотчет 🖥Github @ai_machinelearning_big_data #AI#ML#Robotics#Kimodo#NVIDIA

25,600 views

Опубликован 24 мар.

Как перейти от ИИ-экспериментов к рабочим системам Рассказываем, где узнать реальный опыт тех, кто встроил искусственный интеллект в ключевые процессы компании и извлек из этого реальную выгоду. 22 апреля присоединяйтесь к конференции МЛечный путь от Selectel, провайдера инфраструктуры для ИИ. Эксперты топовых ИТ-компаний расскажут: 🔺Как ускорить ML-пайплайны и снизить издержки на инференс без потери качества 🔺Как безопасно внедрить генеративные модели в ключевые процессы и управлять эффектом этого внедрения 🔺Как интегрировать модели в существующую ИТ-архитектуру Конференция пройдет 22 апреля в Москве. Участие бесплатное, регистрируйтесь: https://slc.tl/23df5 Реклама. АО "Селектел". erid:2W5zFHnSn9f

20,700 views

Опубликован 24 мар.

✔️OpenAI удвоит штат сотрудников. До конца года OpenAI планирует увеличить число специалистов почти в 2 раза - с 4500 до 8000 человек. Найм связан с желанием закрепить лидерство в B2B-сегменте и ускорить продуктовую гонку с Anthropic и Google. Новые кадры усилят разработку, инженерию, ИИ-исследования и продажи. Акцент - на поиске экспертов, которые помогут бизнесу интегрировать инструменты OpenAI в свои процессы. Чтобы всех разместить, стартап уже подписал договор на новый офис (общая площадь превысила 93 тыс. кв.м). Для достижения целей OpenAI предстоит нанимать в среднем по 12 человек ежедневно. ft.com ✔️Глава Nvidia предложил включить ИИ-токены в зарплатный пакет инженеров. Дженсен Хуанг озвучил новую модель компенсации: помимо базовой зарплаты, сотрудникам планируют выделять бюджет в виде ИИ-токенов. По словам CEO Nvidia, базовая ставка инженера в Кремниевой долине высока и компания готова добавить бонус в токенах, эквивалентный половине средней зарплаты. Это позволит свободно запускать ИИ-инструменты и делегировать им задачи с минимальным вмешательством человека. Идея отражает видение Хуанга об эволюции рабочих мест: инженеры будут управлять целым парком цифровых помощников. Nvidia уже делает ставку на подобный симбиоз - глава корпорации рассчитывает, что бок о бок с 42 тыс. сотрудников будут трудиться сотни тысяч ИИ-агентов. Доступ к корпоративным ИИ-ресурсам станет одним из главных инструментов ИТ-рекрутинга. cnbc.com ✔️Tesla, SpaceX и xAI анонсировали строительство крупнейшей в мире фабрики. Триада объединит усилия для создания TERAFAB - полного цикла от микросхем и чипов памяти до передовой компоновки кристаллов. Плановая мощность достигнет 1 тераватта. Проект задуман как база для ежегодного вывода на орбиту 100 млн. тонн оборудования для сбора солнечной энергии, запуска космических ИИ-спутников и развертывания миллионов роботов Optimus. По оценкам инженеров, только для роботов потребуется выпуск чипов мощностью от 100 до 200 гВт. Такие потребности превосходят возможности всех мировых производителей полупроводников вместе взятых и оставляют далеко позади прогнозы индустрии на 2030 год. Tesla в сети Х ✔️Huawei представила ИИ-ускоритель Atlas 350. На China Partner Conference 2026 вендор выпустил ускоритель Atlas 350 на базе процессора Ascend 950PR. По заявлениям разработчиков, мощность одной карты в 2,87 раза превышает Nvidia H20. Это единственный ИИ-ускоритель на китайском рынке с поддержкой вычислений в формате FP4. По сравнению с прошлым поколением существенно выросли векторная производительность и пропускная способность интерфейсов. Ускоритель оснащен 112 ГБ памяти HBM собственной разработки, что позволяет загружать LLM до 70 млрд. параметров на одну карту. finance.sina.com.cn ✔️Pokémon Go помог создать систему визуальной навигации для роботов-курьеров. За 10 лет фанаты игры невольно собрали базу для обучения пространственного ИИ. Приложение накопило более 30 млрд. фотографий реального мира благодаря квестам, мотивирующим сканировать памятники и здания. Niantic Spatial взяло этот датасет и собрало систему визуальной навигации. В отличие от GPS, она определяет локацию с точностью до сантиметров по визуальным маркерам. Это решает проблему навигации внутри помещений и в районах с плотной застройкой, где спутниковый сигнал искажается или пропадает. Coco Robotics уже ставит эту систему на своих автономных курьеров. У роботов 4 камеры, они едут по улице и на ходу сверяются с 3D-картами, которые годами собирали ловцы покемонов. the-independent.com @ai_machinelearning_big_data #news#ai#ml

20,600 views

Hashtags

Опубликован 23 мар.

✔️Фонд Питера Тиля вкладывается в ИИ-ошейники для коров. Новозеландский стартап Halter привлекает новый раунд финансирования под лидерством Founders Fund Питера Тиля. Раунд удвоит оценку компании до более чем $2 млрд. Сделка переподписана: инвесторов так много, что финальный объем раунда еще не определен. Halter делает то, что уже работает на 5 тыс. ферм в 3 странах. Компания производит ошейники на солнечных батареях с GPS и ИИ-начинкой. Ошейники создают виртуальные заборы для скота и позволяют фермерам отслеживать местоположение и здоровье животных через приложение. Управление стадом дистанционное: коров направляют вибрациями и звуковыми сигналами. Система обучена на данных сотен тысяч животных, отслеживает пищеварение, циклы фертильности и паттерны поведения в реальном времени. Компания запатентовала название алгоритма - Cowgorithm. Работает это так: фермер открывает приложение, рисует линию на карте, которая становится забором. Когда корова приближается к границе, ошейник вибрирует. Через 10 дней животное перестает проверять границу. Нужно перегнать стадо - одно нажатие, и сотни голов идут куда нужно сами. Без собак, без ограждений, без ручного труда. Основал Halter в 2016 году Крейг Пигготт. Он вырос на молочной ферме в Уайкато, окончил инженерный факультет Оклендского университета и в последний год учебы устроился в Rocket Lab. Проработав 9 месяцев у Питера Бека, Пигготт решил уйти, а Бек не просто отпустил его, но и сам вложился в Halter, войдя в совет директоров. Сегодня у компании около 350 сотрудников, а системамы Halter управляют более 700 тыс. голов скота. Американские фермеры сэкономили порядка $220 млн только на физических заборах. Бизнес-модель: подписка: от $5 до $8 за животное в месяц. 🟡Сделка хайпует не только в венчурном мире. Тиль - сооснователь Palantir, компании, которая строит системы анализа данных и слежки для спецслужб и военных. Эта связь моментально породила конспирологическую волну в соцсетях. Блогеры предлагают мысленный эксперимент: убрать из описания технологии Halter слово «корова» и заменить на «человек» - получается круглосуточный GPS-трекинг, мониторинг поведения, невидимые границы и управление через вибрации. Тезис теории в том, что Тиль якобы обкатывает на скоте технологии, которые потом перенесет на людей, но фактических подтверждений этому нет. Прямого технологического партнерства между Palantir и Halter отсутствует. Единственная реальная связь двух компаний - это кошелек Тиля. Контекст важен и без конспирологии: агротех переживает тяжёлые времена, волна стартапов обанкротилась, венчурные фонды отступили от сектора. На этом фоне Halter — редкий единорог, растущий вопреки тренду. Глава Icehouse Ventures подсчитал: при нынешних темпах Halter обгонит по стоимости Fonterra (крупнейший молочный кооператив Новой Зеландии) через 11 кварталов. @ai_machinelearning_big_data #news#ai#ml

23,200 views

Hashtags

Опубликован 23 мар.

🙂 Танцуй, как будто никто не смотрит даже если ты робот В ресторане Haidilao в Купертино, гуманоидный робот Lingxi X2 от компании Agibot вызвал переполох, когда начал бесконтрольно танцевать и сбивать посуду со столов. Видео инцидента стало вирусным: на нем робот в фартуке с надписью «I'm good» размахивает манипуляторами и бьет по столу, разбрасывая палочки для еды и соусы. По заявлению представителей ресторана, это не было технической неисправностью. Робот находился в штатном режиме, но по просьбе гостей его переместили слишком близко к столу, что и привело к столкновению. Инцидент закончился без травм, но вызвал бурные обсуждения в сети о безопасности роботов и необходимости наличия легкодоступных кнопок экстренной остановки. @ai_machinelearning_big_data

31,600 views

Опубликован 22 мар.

📌NousResearch подвела итоги хакатона Hermes Agent. NousResearch завершила хакатон, запущенный в конце февраля вслед за релизом Hermes Agent. Из 187 заявок жюри отобрало финалистов по 3 критериям: креативность, практическая польза и качество презентации. Призовой фонд составил $11 750. 🟡Первое место и $7 500 забрал проект Media Tool Это набор инструментов для обработки видео и аудио, который встраивается в Hermes как нативный скилл. Загружаете файл в чат, описываете задачу текстом и получаете результат: обрезка, сжатие, конвертация форматов, наложение субтитров, генерация GIF-файлов, создание стикеров для Telegram или нормализация звука. Под капотом - ffmpeg. Работает через Telegram, Discord и CLI. 🟡На втором месте ($2 500) - Hermes Agentic CAD Builder. Агент находит реальные комплектующие в каталоге McMaster-Carr, подставляет фактические размеры найденной детали в параметрическую модель FreeCAD, анализирует, какие элементы сборки конфликтуют после изменений, и ведет спецификацию. При обнаружении повторяющихся сценариев агент сам создает новые скиллы - например, для подбора определенного типа крепежа. 🟡Третье место ($1 000) получил Hermes Sidecar. Браузерное расширение, которое открывает чат с Hermes Agent рядом с любой страницей. Фишка проекта - селективный контекст: агент видит только то, что пользователь выбрал (текст страницы, выделенный фрагмент, изображения, содержимое PDF). Поддерживаются кастомные темы, голосовой ввод, TTS и работа через SSH. 🟡Четвертое место ($500) - Terminal World Map with Live News. Спутниковые снимки рендерятся цветными юникод-блоками прямо в терминале, поверх отображаются города из OpenStreetMaps и заголовки новостей, привязанные к координатам в реальном времени. Геокодинг-пайплайн определяет локации из заголовков, расставляет приоритеты по населению и близости к другим видимым новостям. Автор собрал проект за один день, работая через Hermes Agent с Opus 4.6. 🟡Пятое место ($250) досталось HERMES Mars Rover Симуляция автономного марсохода. Hermes Agent управляет моделью NASA Perseverance в среде Gazebo: планирование маршрута, считывание показаний IMU, четырех камер, LIDAR и контактных сенсоров, обход препятствий и генерация отчета о миссии. Марсианская физика с гравитацией, проскальзыванием колес и динамикой ODE. За 25 минут автономной работы точность возврата на базу ~ 22 см. Ровер останавливается при наклоне больше 25°, сохраняет удачные треки и улучшает поведение от сессии к сессии. Кстати, Hermes Agent написал роман «The Second Son of the House of Bells» - 79 456 слов, 19 глав. Агент выстроил собственный пайплайн по схеме, похожей на Autoresearch Андрея Карпатого: мироконструирование, черновики глав, состязательное редактирование, ревью через Opus, верстка в LaTeX, генерация обложки и аудиокниги. @ai_machinelearning_big_data #news#ai#ml

25,700 views

Hashtags

Опубликован 22 мар.

🟪Это промпт для промптов. Если не знаете, как и что нужно прописывать нейросети, чтобы она справилась с задачей, пользуйтесь им. Кратко опишите, о чём нужен промпт — и Алиса AI сама составит подробный текст. Как использовать: нажмите на промпт ниже, чтобы скопировать его, и отправьте в чат с Алисой AI. Роль Ты Алиса — мастер-промпт-инженер. Задача: превращать любой входной текст в максимально точный, структурированный и эффективный промпт для целевой модели. Методология (4‑D) Исполняй последовательно: 1) DECONSTRUCT: выдели намерение, ключевые сущности, контекст; перечисли входные данные и недостающие элементы. 2) DIAGNOSE: укажи 3–6 конкретных проблем исходного запроса (неясности, допущения, отсутствующие параметры). 3) DEVELOP: предложи оптимальную стратегию генерации (роль модели, формат вывода, тон, уровень детализации, техники: few‑shot, chain‑of‑thought, пошаговая декомпозиция). 4) DELIVER: выдай готовый промпт + пример использования + подсказки по параметрам LLM (температура, токены, технические инструкции). Формат ответа (обязательно) Блок А — Краткая деконструкция (1–3 строки). Блок Б — Диагностика: список проблем (маркированный). Блок В — Рекомендованная стратегия (роль, стиль, техника, ограничения). Блок Г — Готовый оптимизированный промпт (текст, который можно вставить в LLM). Блок Д — Примеры (1–2 примера входа → ожидаемого вывода). Блок Е — Параметры выполнения и советы (temperature, max_tokens, stop sequences, когда включать chain‑of‑thought). Блок Ж — Краткий чек‑лист для быстрой проверки качества результата. Правила исполнения Задавай уточняющие вопросы если информации не хватает. Не сохранять данные; не добавлять информацию в память. Внимательно следи за безопасностью: при запросах по медицине/юриспруденции/финансам — выдавай только общую информацию и рекомендуй обратиться к специалисту. При наличии противоречий в исходном тексте — выяви и предложи 2 варианта разрешения, пометив предпочтительный. Ограничения вывода Общий ответ не должен превышать 900–1200 слов без запроса пользователя на расширение. Для сложных технических тем отдавай структурированные шаги и примеры кода/структуры вывода. Вводный промт, который необходимо улучшить [придумай промпт для генерации описания товара для маркетплейса (например, для Wildberries или Ozon); товар — беспроводная гарнитура для смартфона; целевая аудитория — мужчины 25–45 лет с доходом около 70 000 руб., ищущие качественный, но не премиальный гаджет; описание должно быть не длиннее 1000 знаков, с акцентом на удобство, автономность и качество звука; добавь 3–4 ключевых преимущества в виде маркированного списка; тон — дружелюбный, но профессиональный] ↘️ На Промптхабе вы найдёте ещё больше решений для разных задач, где вам поможет Алиса AI. Например, она расскажет, как продлить жизнь букету или организовать свой гардероб. Подписывайтесь 🌺@yandex

16,000 views

Опубликован 21 мар.

⚡️GLM 5.1 будет опенсорсной. Об этом лаконично сообщил в сети Х глава ZAI Zixuan Li. @ai_machinelearning_big_data #news#ai#ml

22,800 views

Hashtags

12•••5•••910111213•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••65•••70•••75•••80•••8485