TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват291,600Просмотры последних постов
Последние посты

Последние посты

Стр. 74 из 85 · 1,009 постов

Опубликован 9 авг.

✔️Microsoft запустила Copilot 3D. Microsoft открыла доступ к экспериментальному веб-инструменту Copilot 3D, который позволяет конвертировать статичные изображения в трехмерные модели. Сервис доступен бесплатно через портал Copilot Labs. Инструмент поддерживает на входе PNG и JPG размером до 10 МБ. Созданные модели сохраняются на странице пользователя в течение 28 дней и могут быть скачаны в формате GLB. Copilot 3D является новой попыткой Microsoft популяризировать 3D-творчество после закрытия проектов Paint 3D и Remix3D. copilot.microsoft.com ✔️Tesla сворачивает проект суперкомпьютера Dojo. Команда, занимавшаяся разработкой суперкомпьютера Dojo расформирована, а ее руководитель Питер Бэннон покидает компанию. Этот шаг завершает многолетнюю попытку Tesla создать кастомные чипы и процессоры "размером с кремниевую пластину" для обучения моделей автономного вождения и робототехники. Вместо этого компания перейдет на решения Nvidia и AMD, а производством чипов нового поколения займется Samsung. Около 20 инженеров из команды Dojo уже основали собственный стартап DensityAI, а остальные сотрудники будут переведены на другие проекты внутри Tesla. bloomberg.com ✔️Apple интегрирует GPT-5 в Apple Intelligence с сентябрьским обновлением ОС. Apple подтвердила, что осенние обновления: iOS, iPadOS и macOS получат поддержку GPT-5. Она заменит текущую GPT-4o в тех случаях, когда собственным моделям Apple потребуется помощь в обработке сложных запросов. Это коснется ответов Siri, инструментов для письма и визуального поиска. Использование GPT-5 останется опциональным: пользователи должны будут явно дать согласие на передачу запросов в ChatGPT. Apple продолжит скрывать IP-адреса и запрещать OpenAI хранить данные, однако оставит возможность привязать платную подписку OpenAI для доступа к дополнительным функциям. Кроме того, обновления ОС принесут функцию Live Translation для перевода разговоров в реальном времени и расширят возможности сквозного поиска по контенту. 9to5mac.com ✔️Компания Марка Цукерберга купила стартап WaveForms AI. Техногигант приобрел WaveForms AI - молодой стартап, чье программное обеспечение способно идентифицировать и воспроизводить эмоциональные оттенки в человеческой речи. Команда WaveForms присоединится к подразделению Superintelligence Labs. Стартап был основан в декабре 2024 года, но уже успел привлечь 40 миллионов долларов инвестиций при оценке в 160 миллионов. Компания работала над "Тестом Тьюринга для речи" и так называемым "эмоциональным AGI", чтобы сделать голоса, сгенерированные ИИ, неотличимыми от человеческих. Для Цукерберга это уже вторая сделка в области ИИ-аудио за последние месяцы после июльского поглощения PlayAI. Финансовые условия покупки не разглашаются. theinformation.com ✔️Google тестирует Google Finance с генеративным ИИ. Google приступил к тестированию редизайна сервиса Google Finance, в центре которого теперь находится ИИ. В ближайшие недели пользователи из США получат доступ к новой версии со встроенным чат-ботом. Он сможет отвечать на сложные вопросы о рынках, предоставляя обобщенные ответы со ссылками на внешние источники. Помимо ИИ-помощника, обновление включает расширенные инструменты для построения графиков и добавляет рыночные данные в реальном времени для сырьевых товаров и криптовалют. Появится и постоянно обновляемая новостная лента, которая позволит отслеживать важные заголовки, не покидая платформу. Во время тестового периода пользователи смогут переключаться между новым и классическим интерфейсами. blog.google @ai_machinelearning_big_data #news#ai#ml

24,400 views

Hashtags

Опубликован 8 авг.

⚡️GGUF-версии GPT-OSS от Unsloth. Unsloth конвертировали обе GPT-OSS (20B и 120B) и исправили ошибки, чтобы повысить качество инференса. 🟡Оптимальный сетап: 🟢20B работает со скоростью более 10 токенов/с при полной точности на 14 ГБ оперативной памяти. 🟢120B с полной точностью будет давать >40 токенов/с на примерно 64 ГБ ОЗУ. Минимальных требований для запуска моделей нет, запуститься можно даже если у вас всего 6 ГБ и только CPU, но инференс будет медленнее. GPU не требуется , особенно для модели 20B, но его наличие значительно увеличивает скорость вывода (~80 токенов/с). С чем-то вроде H100 можно получить пропускную способность 140 токенов/с, и это значительно быстрее, чем у OpenAI в ChatGPT. Модели можно запустить через llama.cpp, LM Studio или Open WebUI. Если модель 120B слишком медленная, попробуйте версию 20B - она очень быстрая и работает не хуже o3-mini. Помимо моделей формата GGUF c полной точностью, Unsloth сделали версии с 4-bit и 16-bit точностью. 4-бинтый квант, кстати, можно файнтюнить на 24 ГБ VRAM. 📌 Подробная пошаговая инструкция по локальному запуску и файнтюну - в документации Unsloth. 🟡Набор моделей 🟡Документация @ai_machinelearning_big_data #AI#ML#GPTOSS#GGUF#Unsloth

32,000 views

Опубликован 8 авг.

🚀Прорыв от Google: активное обучение с экономией данных на 10 000× при дообучении LLM Google разработала масштабируемый процесс *active learning*, который позволяет в десятки тысяч раз сократить объём размеченных данных, необходимых для тонкой настройки больших языковых моделей на сложных задачах — например, при модерации рекламного контента. 🟢 Как работает метод: 1. Стартовая модель (LLM-0) получает промпт и автоматически размечает огромный массив данных. 2. Кластеризация выявляет примеры, где модель путается (наиболее спорные и ценные для обучения). 3. Отбор данных: из этих кластеров выбирают информативные и разнообразные примеры. 4. Экспертная разметка — только для выбранных примеров. 5. Итерации: дообучение модели → новый отбор спорных примеров → разметка → снова обучение. 🟢Результаты: - Сокращение с 100 000 размеченных примеров до менее 500 при сохранении или улучшении качества. - Улучшение метрики *Cohen’s Kappa* на 55–65 %. - В больших продакшн-моделях — до 3–4 порядков меньше данных при сопоставимом или лучшем качестве. 🟢Что такое Cohen’s Kappa? Это метрика, которая показывает, насколько два "судьи" (например, эксперт и модель) согласны между собой с поправкой на случайные совпадения. - 0.0 — нет согласия (или хуже случайного) - 0.41–0.60 — умеренное согласие - 0.61–0.80 — значительное - 0.81–1.00 — почти полное согласие В задачах с дисбалансом классов Kappa даёт более честную оценку, чем обычная точность (accuracy). Чем лучше предыдущих методов: - Точечная разметка: размечаются только самые информативные примеры. - Масштабируемость: метод применим к наборам данных с сотнями миллиардов примеров. - Экономия ресурсов: меньше времени и затрат на разметку. - Быстрая адаптация: подходит для доменов с быстро меняющимися правилами (реклама, модерация, безопасность). 🟢Вывод: При умном отборе данных LLM можно адаптировать в тысячи раз быстрее и дешевле, чем при традиционном обучении на больших размеченных наборах. #GoogleResearch#ActiveLearning#AI#LLM#MachineLearning#DataEfficiency 🟠Почитать подробно @ai_machinelearning_big_data #GoogleResearch#ActiveLearning#AI#LLM#MachineLearning#DataEfficiency

27,400 views

Опубликован 8 авг.

✔️Grok 5 выйдет до конца этого года. Спустя всего час после окончания презентации GPT-5, Илон Маск написал в Х, что следующая итерация модели искусственного интеллекта от xAI, Grok 5, будет выпущена до конца 2025 года, и пообещал, что она будет "разрушительно хороша". Elon Musk в сети Х ✔️OpenAI выплатит бонусы ключевым сотрудникам. OpenAI предложила бонусы за удержание примерно тысяче своих исследователей и инженеров - это около трети всего штата. По данным The Information, суммы выплат варьируются от нескольких сотен тысяч до нескольких миллионов долларов на человека. Эти денежные и акционерные поощрения призваны удержать ключевые таланты в компании. OpenAI сталкивается с агрессивным хантингом со стороны конкурентов, которые активно переманивают ведущих ИИ-специалистов. Выплаты бонусов происходят на фоне слухов о возможной продаже акций, которая может оценить OpenAI в 500 миллиардов долларов - вдвое больше текущей оценки. theinformation.com ✔️NASA и Google Cloud тестируют ИИ-врача для астронавтов. NASA совместно с Google Cloud разработали прототип ИИ-системы, которая поможет астронавтам диагностировать и лечить заболевания в условиях ограниченной связи с Землей. Система под названием «Цифровой ассистент бортового врача» объединяет обработку естественного языка с медицинской литературой по космическим полетам, чтобы генерировать рекомендации по лечению и отслеживать здоровье экипажа. Первые испытания, проведенные по стандартной методике оценки клинической компетентности, показали, что инструмент выдает надежные диагностические предположения. Сейчас модель дорабатывают с практикующими врачами перед ее интеграцией в будущие космические программы. cloud.google.com ✔️Baidu до конца месяца выпустит новую ризонинг-модель. Китайский техгигант планирует представить новую модель, ориентированную на сложные логические рассуждения, уже до конца этого месяца. Кроме того, в ближайшие месяцы компания выпустит обновленную версию своей базовой модели - Ernie 5.0. Первая рмзонинг-модель Baidu представила в марте. Baidu стала одной из первых крупных китайских компаний, запустивших собственный чат-бот Ernie Bot, аналог ChatGPT. Несмотря на ранний старт, в июле Ernie Bot занимал 10-е место по числу активных месячных пользователей среди ИИ-приложений в Китае. wsj.com ✔️Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o. Microsoft объявила, что в ее сервисе Bing Image Creator теперь доступна модель GPT-4o. Она отличается более точным рендерингом текста и лучшим следованием промптам. Кроме того, GPT-4o позволяет редактировать загруженные изображения или использовать их в качестве референса для создания новых. По просьбам пользователей, Microsoft сохранила и предыдущую модель - DALL-E 3. Теперь при создании изображения можно выбрать, какую из двух моделей использовать. Как и раньше, сервис предоставляет 15 «быстрых» генераций. После исчерпания лимита за ускорение придется платить баллами Microsoft Rewards, однако медленная генерация остается неограниченной и бесплатной. Доступ к обновленному инструменту открыт через веб-сайт и мобильные приложения Bing. blogs.bing.com @ai_machinelearning_big_data #news#ai#ml

20,000 views

Hashtags

Опубликован 7 авг.

🔥 А вот и ChatGPT-5 Модель гибридная и выглядит очень круто, особенно в кодинге! На aime-2025 получила 100 процентов! Альтман заявляет, что модель дадут даже бесплатным пользователям и прямо сегодня. https://openai.com/index/introducing-gpt-5/ Стрим, кстати, смотрят 155 к человек: https://www.youtube.com/watch?v=0Uu_VJeVVfo GPT-5 уже доступен в Perplexity, Cursor, Copilot. @ai_machinelearning_big_data #Chatgpt5

41,100 views

Hashtags

Опубликован 7 авг.

🔥 Unitree A2 Stellar Hunter! Новый четырёхногий робот весом всего 37 кг 🚀 Запас хода без нагрузки — 20 км Работа стал: Легче, Прочнее, Быстрее. Разработан специально для промышленных задач, где важны автономность, манёвренность и надёжность. Инженерная мощь нового поколения — в компактном корпусе. @ai_machinelearning_big_data #ai#robots#Unitree

20,100 views

Опубликован 7 авг.

⚡Agent Lightning — ускоритель обучения для ИИ-агентов от Microsoft Agent Lightning — это фреймворк для обучения и оптимизации LLM-агентов с помощью Reinforcement Learning без изменения их кода. 🧠 Поддерживает: • LangChain • AutoGen • OpenAI Agents SDK • и другие фреймворки на Python 🔧 Как он работает: • Агент не нужно переписывать — он подключается как есть • Вся его работа разбивается на отдельные шаги (эпизоды), которые можно анализировать • Специальный алгоритм LightningRL оценивает, какие действия были полезны, а какие — нет • Система может учитывать не только финальный результат, но и промежуточные сигналы (награды) • Эти данные автоматически собираются и используются для дообучения агента 🔥 Преимущества: • Не требует модификации логики агента • Можно легко подключить к существующим пайплайнам • Улучшает точность и устойчивость в сложных задачах: от генерации кода до Text-to-SQL Отличный инструмент для всех, кто хочет сделать своих LLM-агентов. 🟠Проект: https://microsoft.com/en-us/research/project/agent-lightning/ 🟠Статья: https://arxiv.org/abs/2508.03680 🟠Github: https://github.com/microsoft/agent-lightning @ai_machinelearning_big_data #agent#reinforcementlearning#mlops#llm#Microsoft

22,700 views

Опубликован 7 авг.

📌На ИТ-Пикнике — сильный спикерский состав по ИИ и разработке Что расскажут топ-спикеры на фестивале: ✔️ИИ теперь не просто генерирует, он рассуждает как человек. Теперь важен не сбор данных, а построение reasoning-систем, которые умеют решать задачи по цепочке во всех направлениях. ✔️Разбор автономного вождения от базовых принципов до планирования маршрута беспилотными авто. ✔️Опенсорс — зачем все этим занимаются и результаты исследования в рамках создания SourceCraft.dev. ✔️Дискуссия СТО о GenAI и платформах — кто кого обучает, где проходит грань между контролем и автономией и что останется людям в 2030. @ai_machinelearning_big_data #news#ai#opensource

18,500 views

Опубликован 7 авг.

✔️GPT-5 покажут 7 августа в 20.00 МСК. OpenAI представит GPT-5 в ходе прямой трансляции 7 августа в 10 утра по тихоокеанскому времени (20.00 МСК). Это станет первым крупным обновлением с момента выхода GPT-4 в марте 2023 года. По словам тестировщиков, новая система демонстрирует заметный прогресс в программировании и решении научных и математических задач. Однако они отмечают, что скачок по сравнению с GPT-4 менее заметен, чем переход от GPT-3.5 к GPT-4. Сэм Альтман ранее намекал, что в основе GPT-5 лежит гибридный подход: традиционное масштабирование модели сочетается с технологией «test-time compute», которая динамически выделяет дополнительные вычислительные ресурсы для решения особо сложных задач. reuters.com ✔️Grok 2 будет опубликован в оперсорс на следующей неделе. Илон Маск соообщил, что xAI откроет исходный код модели Grok 2 на следующей неделе. Этот шаг последовал за недавним релизом моделей с открытыми весами от OpenAI и свидетельствует об усилении конкуренции в сегменте открытых ИИ-решений. Ожидается, что публикация Grok 2 в открытом доступе ускорит совместную разработку в области ИИ и укрепит репутационные позиции xAI в сообществе разработчиков. Elon Musk в сети Х ✔️Microsoft начала тестировать Gaming Copilot. Компания запустила бета-тестирование Gaming Copilot, ИИ-помощника, встроенного в Game Bar Windows 11. Функция доступна участникам программы Xbox Insiders и впервые интегрирует технологию Xbox Copilot непосредственно в игровой процесс на ПК. Ассистент распознает, в какую игру играет пользователь, и может анализировать скриншоты, достижения и историю, чтобы отвечать на вопросы, предлагать стратегии и делать снимки экрана, не выходя из полноэкранного режима. Поддерживается голосовое управление, чтобы геймеры могли в реальном времени запрашивать, например, тактику для битвы с боссом или совет по выбору персонажа. На данный момент превью доступно только на английском языке в США, Австралии, Новой Зеландии, Японии и Сингапуре. theverge.com ✔️Jules от Google вышел из беты. Спустя 2 месяца после начала публичного тестирования, Google официально выпустила своего ИИ-агента для программирования Jules. Инструмент, работающий на модели Gemini 2.5 Pro, способен в асинхронном режиме клонировать кодовые базы, создавать pull-запросы на GitHub и самостоятельно выполнять задачи по исправлению багов или обновлению зависимостей. С релизом компания представила трехуровневую систему тарификации. Бесплатный план включает до 15 задач в день. Платный доступ интегрирован в подписки Google AI: тариф Pro увеличивает лимиты Jules в 5 раз, а Ultra - в 20 раз. blog.google ✔️Anthropic выпустила опенсорсный инструмент для автоматической проверки кода на уязвимости. Инструмент, получивший название Claude Code Security Reviewer, использует модель Claude и интегрируется в GitHub Actions, сканируя pull-запросы на наличие потенциальных проблем с безопасностью. Благодаря способности Claude понимать контекст кода, система может находить уязвимости в разных языках программирования. Она автоматически добавляет комментарии к проблемным участкам, отсеивает вероятные ложные срабатывания и анализирует только измененные файлы. Инструмент доступен на GitHub под лицензией MIT. anthropic.com @ai_machinelearning_big_data #news#ai#ml

20,100 views

Hashtags

Опубликован 6 авг.

🚀Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507 — ловите еще один апдейт от Qwen: LLM с поддержкой 256K контекста 🧠Qwen3-4B-Instruct — идеально подойдёт для: • генерации текстов • многоязычных задач • сложных промптов 🧠Qwen3-4B-Thinking — заточен под: • логику • математику • программирование и технический анализ ⚡ Обе модели стали: • точнее • логичнее • лучше справляются с длинными диалогами 🔗 Модели на Hugging Face: https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507 https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507 🔗 Модели на ModelScope: https://modelscope.cn/models/Qwen/Qwen3-4B-Instruct-2507 https://modelscope.cn/models/Qwen/Qwen3-4B-Thinking-2507 @ai_machinelearning_big_data #AI#ML#qwen#opensource

22,400 views

Опубликован 6 авг.

🖥gpt-oss работает на специальном формате промптов — Harmony, и без него модель просто не будет выдавать корректные ответы. Зачем нужен Harmony? Этот формат нужен для: — 🧠 генерации chain of thought рассуждений — 🔧 корректного вызова функций и использования инструментов — 📦 вывода в разные каналы: обычный ответ, reasoning, tool call — 🗂️ поддержки tool namespaces и иерархических инструкций 💡 Harmony имитирует OpenAI Responses API, так что если вы с ним работали — будет легко освоиться. 👉 Если вы используете gpt-oss через HuggingFace, Ollama или vLLM, волноваться не нужно. Но если строите свой пайплайн — обязательно изучитегайд по Harmony. Без него модель просто не будет работать как надо. pip install openai-harmony # or if you are using uv uv pip install openai-harmony @ai_machinelearning_big_data #gptOSS#Harmony#OpenAI#LLM#PromptEngineering

24,600 views

Опубликован 6 авг.

✔️Anthropic обновила Claude Opus до версии 4.1. Claude Opus 4.1 - обновленная версия флагманской модели Anthropic. Улучшили агентные задачи, работу с кодом и логические рассуждения. На бенчмарке SWE-bench Verified новая модель достигла результата в 74.5%. Партнеры Anthropic хвалят обновленную модель. В GitHub заявили об улучшении большинства показателей, особенно в рефакторинге кода в нескольких файлах. А в Rakuten Group оценили способность модели находить точные исправления в больших кодовых базах, не внося лишних изменений. Opus 4.1 уже доступен платным пользователям Claude, в среде Claude Code, а также через API, Amazon Bedrock и Google Cloud Vertex AI. Цена на новую модель осталась такой же, как и на Opus 4. anthropic.com ✔️DeepMind представила модель генерации интерактивных 3D-миров в реальном времени. Google DeepMind анонсировала Genie 3, свою новую «модель мира», способную по одной текстовой команде создавать полностью интерактивные трехмерные окружения. Ключевая особенность системы 3 поколения - генерация сцен в реальном времени. Genie 3 выдает видео в разрешении 720p с частотой 24 кадра в секунду и способна поддерживать связную симуляцию на протяжении нескольких минут, что на порядок дольше предыдущей версии. Модель обладает минутной визуальной памятью для сохранения консистентности объектов, а также поддерживает «события по запросу» — пользователи могут менять погоду или добавлять персонажей прямо во время сессии. В DeepMind рассматривают технологию как источник практически неограниченных синтетических данных для обучения роботов и беспилотных автомобилей. Пока Genie 3 доступна в режиме ограниченного превью для небольшой группы ученых и авторов контента. deepmind.google ✔️США изучают возможность встраивать в ИИ-чипы отслеживание геолокации. Высокопоставленный чиновник Белого дома подтвердил, что правительство США рассматривает способы оснащения ИИ-чипов улучшенными возможностями отслеживания местоположения. Эта мера является частью стратегии по ограничению поставок передовых полупроводников, производимых Nvidia, в Китай. Идея заключается в том, чтобы с помощью программных или аппаратных изменений в самих чипах более эффективно контролировать их перемещение и пресекать контрабанду. Этот пункт прямо включен в недавно представленный US AI Act. Новость появилась на фоне недавнего вызова представителей Nvidia в правительство Китая для обсуждения как раз вопросов геолокации и других предполагаемых рисков, связанных с чипами H20. В Nvidia отказались от комментариев, но ранее заявляли об отсутствии «бэкдоров» в своей продукции. bloomberg.com ✔️xAI запустила Grok Video с режимом генерации NSFW-контента. Компания Илона Маска представила Grok Imagine - инструмент для image-to-video и text-to-image генерациq. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS. Ключевым отличием от конкурентов стал режим «Spicy». Он прямо разрешает создание обнаженных и сексуализированных изображений, в то время как прямые конкуренты используют строгие контент-фильтры. Пользователи могут выбирать один из четырех стилей анимации: Custom, Normal, Fun и Spicy. Маск сообщил, что за первые дни после запуска пользователи сгенерировали более 34 миллионов изображений. theverge.com ✔️ElevenLabs релизнула модель для создания музыки по текстовым запросам. ElevenLabs запустила новый сервис Eleven Music. Это ИИ-модель, которая преобразует текстовые описания в готовые песни, джинглы и фоновые треки. Сервис доступен как для частных лиц, так и для бизнеса. Весь сгенерированный контент подходит для коммерческого использования. Для этого ElevenLabs обучила свою модель исключительно на лицензированных материалах и заключила соглашения с крупными управляющими цифровыми правами, Merlin Network и Kobalt Music Group. Кроме того, в систему встроены защитные механизмы, блокирующие запросы, которые могут привести к созданию оскорбительного контента. elevenlabs.io @ai_machinelearning_big_data #news#ai#ml

18,300 views

Hashtags

12•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••65•••70•••7273747576•••80•••8485