TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват293,300Просмотры последних постов
Последние посты

Последние посты

Стр. 68 из 85 · 1,009 постов

Опубликован 30 авг.

✔️Следующая модель семейства LLama выйдет к концу этого года. Разработкой занимается новое подразделение компании Марка Цукерберга Superintelligence Labs. Модель, которую некоторые внутри компании называют Llama 4.5, должна исправить недостатки предыдущих версий: слабую производительность в кодинге и логических рассуждениях. Параллельно команда работает над исправлением ошибок в уже выпущенных версиях Llama 4 и фоном допиливает флагманскую модель "Behemoth". businessinsider.com ✔️Apple опубликовала семейство моделей FastVLM. FastVLM - линейка ультрабыстрых VL-моделей с гибридным энкодером FastViTHD, который значительно сокращает количество визуальных токенов и ускоряет их обработку. В сравнении с LLaVA-1.5, FastVLM показала в 3.2 раза более быстрый TTFT при сопоставимой производительности, а с LLaVa-OneVision модель достигает аналогичных результатов на бенчмарках, используя в 3.4 раза меньший энкодер. В семейство входят три модели размером 500 миллионов, 1.5 миллиарда и 7 миллиардов параметров. Все они уже доступны на Hugging Face для некоммерческого использования. huggingface.co ✔️PixVerse запустила новую модель V5 для генерации видео. Обновление принесло значительные улучшения в качестве движений, визуальной детализации, согласованности и точности исполнения текстовых запросов. Новая функция Agent позволяет создать 5–30-секундный ролик, просто загрузив одно фото. Генерация видео в разрешении 360p занимает 5 секунд, а 1080p - около минуты. До 1 сентября 2025 года доступ к V5 предоставляется бесплатно. Модель работает через веб-интерфейс, мобильные приложения и API. Pixverse в сети X ✔️Google встроила Gemini CLI в редактор кода Zed. Интеграция позволяет разработчикам генерировать и рефакторить код, а также общаться с ИИ, не покидая редактор. Изменения применяются в реальном времени и могут быть проверены в интерфейсе, похожем на pull-request. Gemini работает через открытый протокол Agent Client Protocol, созданный Zed для связи ИИ-агентов со средами разработки. Zed основан на Rust и позиционируется как открытая альтернатива Microsoft VS Code. developers.googleblog.com ✔️В Финляндии разработали умную упаковку с ИИ-распознаванием. Исследователи из Университета Ваасы предложили дешевую и экологичную альтернативу электронным датчикам для контроля состояния продуктов. Технология основана на использовании функциональных чернил, которые меняют цвет при изменении температуры или влажности, а сверточные нейронные сети с высокой точностью распознают даже малейшие изменения, которые не улавливают традиционные методы машинного зрения. Это решает проблему своевременного обнаружения порчи или повреждений. Такие индикаторы можно наносить прямо на упаковку вместе с обычными этикетками, что почти не увеличивает стоимость. Технология может найти применение в пищевой промышленности и в фармацевтике для отслеживания условий хранения продукции. interestingengineering.com ✔️ Скандал: xAI подала в суд на бывшего инженера xAI обвиняет Xuechen Li в краже технологий Grok и попытке передать их OpenAI. Факты: - Продал акции xAI на $7 млн и уволился. - Скопировал секретные файлы Grok на личное хранилище. - Удалял логи и признался письменно. xAI требует: вернуть и удалить данные, запретить Li работать над ИИ в OpenAI и выплатить компенсацию. @ai_machinelearning_big_data #news#ai#ml

28,200 views

Hashtags

Опубликован 29 авг.

🚀 OpenAI **gpt-oss** с ультрадлинным контекстом! Unsloth выпустили Flex Attention, который даёт до 61K контекста для gpt-oss bf16 при обучении на GPU с 80GB. 📊 Что это значит: - 8× больше контекста - потребляет на 50% меньше VRAM - 1.5× быстрее по сравнению с альтернативами (включая FA3) Для BF16 LoRA теперь можно тренировать с ~60K контекстом на одной H100 80GB. 🔗 Подробнее: https://docs.unsloth.ai/basics/long-context-gpt-oss-training @ai_machinelearning_big_data #Unsloth#OpenAI#gptoss#chatgpt

25,500 views

Опубликован 29 авг.

✨Awesome-falsehood — это подборка «заблуждений программистов», в которые мы часто верим, но которые на самом деле ложные. В списке собраны распространённые ошибки и мифы из разных областей: даты и время, email, география, телефонные номера, почтовые адреса, интернационализация, работа с сетью, бизнес-логика, мультимедиа, типографика, идентификация пользователей, общество и даже наука. - Помогает не попадаться на типичные грабли. - Каждый раздел содержит реальные примеры и пояснения, почему привычные предположения не работают. - От банального «валидный email всегда содержит один @» до сложного — «почтовый адрес можно записать в фиксированном формате» или «часовые пояса не меняются». 🔥 Репозиторий давно стал must-read для разработчиков, чтобы проектировать системы без скрытых багов. 👉 Провеить свои заблуждения иожно здесь: https://github.com/kdeldycke/awesome-falsehood @ai_machinelearning_big_data #awesome#github

23,900 views

Опубликован 29 авг.

⚡️ Полнометражный документальный фильм про Python На Youtube вышла документалка о том, как создавался язык программирования Python и о том, как IT-сообщество сделало его одним из основ современной кодовой базы. Для тех, кто хочет посмотреть на русском, можно открыть ссылку в Яндекс Браузере и включить нейросетевую озвучку живыми голосами. @ai_machinelearning_big_data #coding#Python

22,400 views

Опубликован 29 авг.

🎯🔁 Ещё один любопытный спортивный робот — на этот раз от UC Berkeley. Инженеры показали гуманоида, играющего в настольный теннис и способного отбить 106 ударов подряд. Работает полностью автономно, без телоуправления. - Планировщик прогнозирует траекторию мяча и выбирает точку, время и скорость удара. - Контроллер на основе RL превращает план в согласованные движения рук и ног, удерживая баланс при замахе. - Обучение основано на видео с реальных матчей, поэтому удары выглядят естественно, а не «роботизировано». - Контур управления работает быстрее секунды, что позволяет вести долгие розыгрыши без сбоев. @ai_machinelearning_big_data #Berkeley#robots

20,900 views

Опубликован 29 авг.

🦾Демонстрация Unitree G1 прошла на UFC Shanghai Президент UFC Дана Уайт столкнулся с неожиданным приемом робота на шоу в Шанхае. В мае те же G1 участвовали в «Mecha Fighting Series» на World Robot Competition в Ханчжоу Живые спорт-ивенты всё чаще становятся витриной для робототехники. @ai_machinelearning_big_data #Unitree#ufc#robots

20,000 views

Опубликован 29 авг.

⚡️OLMoASR: открытые ASR-модели от AI2. Институт искусственного интеллекта Аллена выпустил OLMoASR, семейство из 6 моделей для автоматического распознавания английской речи. ▶️Линейка моделей: 🟢OLMoASR-tiny.en (39M); 🟢OLMoASR-base.en (74M); 🟢OLMoASR-small.en (244M); 🟢OLMoASR-medium.en (769M); 🟠OLMoASR-large.en-v1 (1.5B) обученная на 440 тыс. часов аудио; 🟠OLMoASR-large.en-v2 (1.5B) обученная на 680 тыс. часов аудио; По результатам тестов на 21 датасете, модели OLMoASR показали производительность, сопоставимую с Whisper от OpenAI, а в некоторых случаях и превзошли ее, особенно при работе с длинными аудиозаписями. Проект полностью открытый: опубликованы не только веса моделей, но и датасет, код для обработки данных, а также скрипты для обучения и оценки. Все компоненты, включая код и данные, доступны на GitHub и Hugging Face. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей 🟡Техотчет 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#ASR#OLMoASR#AI2

31,200 views

Опубликован 29 авг.

✔️Microsoft AI представила первые полностью собственные ИИ-модели. Корпорация анонсировала 2 новые модели, разработанные полностью внутри компании: MAI-Voice-1 для синтеза речи и большую языковую модель MAI-1-preview. Разработку возглавляет Мустафа Сулейман, сооснователь DeepMind, который теперь руководит подразделением Microsoft AI. Модель MAI-Voice-1 может генерировать минуту высококачественного аудио менее чем за секунду на одном GPU. Она уже используется в некоторых функциях Copilot и доступна для тестирования разработчиками. MAI-1-preview - первая собственная фундаментальная языковая модель Microsoft. Она уже проходит тестирование на LMArena, и в ближайшие недели ее начнут интегрировать в отдельные функции Copilot. Внешним разработчикам также предоставят ранний доступ. microsoft.ai ✔️Copilot появился на телевизорах и мониторах Samsung. Microsoft интегрировала Copilot в линейки Neo QLED, OLED и The Frame телевизоров и мониторов Samsung . Ассистент доступен через операционную систему Tizen в интерфейсе «Samsung Daily+» и активируется кнопкой микрофона на пульте. Пользователи могут задавать вопросы, получать рекомендации и искать информацию о фильмах. Ответы предоставляются в виде голосовых реплик и визуальных карточек с изображениями и рейтингами. На экране появляется анимированный персонаж, синхронизирующий мимику с разговором. Функция бесплатна, но на старте доступна только в некоторых регионах. microsoft.com ✔️Google открыла бесплатный доступ к ИИ-видеоредактору Vids. Google сделала Vids доступным для всех владельцев аккаунтов Google. Ранее инструмент был эксклюзивом для подписчиков Workspace. Бесплатная версия включает базовые шаблоны, доступ к стоковым медиа и часть ИИ-возможностей. Одновременно с этим, подписчики Workspace и Google AI получили новые премиум-функции: image-to-video на базе Veo 3, фотореалистичные ИИ-аватары, способные зачитывать текст пользователя, и функция автоматической обрезки, которая убирает паузы и слова-паразиты из записанной речи. В будущем появятся функции шумоподавления и поддержка вертикальных форматов кадра. workspace.google.com ✔️Anthropic начнет обучать модели Claude на данных пользователей. Компания объявила о кардинальном изменении своей политики конфиденциальности. Теперь данные из чатов и сессий кодирования пользователей будут использоваться для обучения ИИ-моделей компании, а срок их хранения увеличится до 5 лет. Новые правила вступают в силу 28 сентября. Изменение коснется всех потребительских тарифов Claude, включая бесплатный. При этом оно не затронет корпоративные и образовательные планы, а также использование через API. Пользователям будет предложено сделать выбор во всплывающем окне. Важно отметить, что опция, разрешающая использование данных, включена по умолчанию. Хотя решение можно будет изменить в любой момент в настройках, это не будет иметь обратной силы для уже собранных данных. anthropic.com ✔️Исследование: люди начали использовать в речи слова, характерные для ChatGPT. В Университете штата Флорида провели исследование 22 миллионов слов из подкастов и спонтанной речи и обнаружили статистически значимый рост употребления терминов, которые часто используют большие языковые модели, в частности, ChatGPT. С момента публичного запуска чат-бота в конце 2022 года частота использования слов "surpass", "boast", "meticulous" и "strategically", выросла более чем вдвое. В то же время, частота их синонимов, не популярных у ИИ, не изменилась. Исследователи отмечают, что впервые в новейшей истории лингвистики наблюдается столь быстрый и масштабный сдвиг в словарном запасе, вызванный нечеловеческим фактором. news.fsu.edu @ai_machinelearning_big_data #news#ai#ml

21,400 views

Hashtags

Опубликован 28 авг.

🚀Grok Code Fast 1 — новая модель от xAI, быстрый и недорогой агент для кодинга. Новая модель для повседневных задач программирования с упором на agentic-coding (циклы рассуждений + вызовы инструментов: grep, терминал, редактирование файлов). Обучена на огромном корпусе кода и дообучена на реальных PR/задачах. 🙌 Модель уже доступна бесплатно на популярных платформах: GitHub Copilot, Cursor, Cline, Kilo Code, Roo Code, opencode и Windsurf. Контекст 256k токенов, лимиты: до 2M токенов в минуту и 480 запросов в минуту. ⚡ Особенности: - Новая лёгкая архитектура, разработанная с нуля - Заточена на скорость и эффективность - Показвает хорошие результаты в TypeScript, Python, Java, Rust, C++, Go 💰 Стоимость через xAI API: - $0.20 / 1M входных токенов - $1.50 / 1M выходных токенов - $0.02 / 1M кешированных токенов в 6 раз дешевле, чем GPT-5. Команда Grok обещает выпускать регулярные обновления и уже тренирует вариант с мультимодальным вводом, параллельными tool-calls и расширенным контекстом. 🟠Подробности: https://x.ai/news/grok-code-fast-1 🟠Гайд по промпт-инжинирингу: https://docs.x.ai/docs/guides/grok-code-prompt-engineering @ai_machinelearning_big_data #xAI#Grok#AI#coding

27,900 views

Опубликован 28 авг.

🖥 OpenAI представили gpt-realtime: свою самую продвинутую на сегодня модель «речь-в-речь». Цены: > $32 за 1 миллион аудио-входных токенов > ($0.40 за 1 миллион кэшированных входных токенов) > $64 за 1 миллион аудио-выходных токенов 📊 MultiChallenge (Audio), точность следования инструкциям: - gpt-realtime: 30.5% - gpt-4o-realtime-preview-2025-06-03: 26.5% - gpt-4o-realtime-preview-2024-12-17: 20.6% 🎯 ComplexFuncBench (Audio), точность выполнения инструкций по голосу: - gpt-realtime: 66.5% - gpt-4o-realtime-preview-2025-06-03: 58.9% - gpt-4o-realtime-preview-2024-12-17: 49.7% Чем интересна: - Скачок в понимании голосовых инструкций и точном следовании аудио-командам - Меньше косяков в понимании речи - Модель готова для реального продакшена в голосовых ассистентах и колл-ботах GPT-Realtime обучали на качественных данных и с помощью специализированных reward-моделей, звучит очень годно. 🟢Попробовать @ai_machinelearning_big_data

22,300 views

Опубликован 28 авг.

AI VK & Pro: как это было Вчера прошел первый ивент AI VK & Pro в .оригинале: встреча про рекомендательные системы собрала, кажется, всех, кто делает RecSys (и не только). Ребята раздали стиля. Из интересного: команда RecSys VK рассказала про стратегию рекомендаций в VK, про технологии глубокого понимания контента, про единую рекомендательную платформу и многое другое Определенный плюс вайб: DJ-сеты, интерактивы, турнир по су-е-фа и нетворк Спасибо организаторам и спикерам за контент и настроение. Если делаете рекомендации, такое пропускать не стоило @ai_machinelearning_big_data

21,000 views

Опубликован 28 авг.

⚡️200+ готовых сценариев для n8n Нашёл простой и полезный ресурс: GitHub-репозиторий с 200+ бесплатными workflow для n8n. Темы: продажи, маркетинг, учёт финансов, кодинг и личная продуктивность. Что такое n8n - Open-source инструмент для автоматизации без кода - Визуальный конструктор: соединяете блоки и получаете процесс - Есть сотни интеграций: почта, CRM, таблицы, мессенджеры, вебхуки - Можно добавлять свою логику на JavaScript - Запуск по расписанию или по событию, работает в облаке или на своём сервере Как воспользоваться: 1) Скачайте нужный workflow (.json) и импортируйте в n8n 2) Вставьте свои API-ключи и учётные данные в блоки 3) Проверьте шаги и включите запуск по cron или webhook ▪Github Update - еще 300 готовых решений: https://github.com/kossakovsky/n8n-installer @ai_machinelearning_big_data #n8n#ai#ml

28,600 views

Hashtags

12•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••656667686970•••75•••80•••8485