TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #8606 · 22 сент.

🐳 Обновленная DeepSeek-V3.1-Terminus Она даёт более стабильные и полные результаты на тестах по сравнению с предыдущей версией. Языковая консистентность -китайцы значительно улучшили вывод модель - меньше случайных иероглифов и мешанины CN/EN. Ряд Агентных апгрейдов рузльтаты на Code Agent и Search Agent стали заметно сильнее. Доступна в приложении и в веб-версии и через API. 🔗 Открытые веса: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus @ai_machinelearning_big_data #DeepSeek#opensource#llm

Результаты

Найдено 10 похожих постов

Компания Маска xAI представила новую ИИ-модель Grok 3, которая превосходит #DeepSeek R1 и на уровне o1-pro от OpenAI за $200/месяц Всего за 1 год работы xAI удалось создать модель, конкурирующую с лидерами индустрии. Особенно впечатляет скорость развития и внедрение инновационных подходов, таких как режим Thinking. При этом команда продолжает активную работу над улучшением модели, обещая регулярные обновления. Сравнение с конкурентами: - Сопоставим по возможностям с o1-pro от OpenAI ($200/месяц) - Превосходит DeepSeek-R1 и Gemini 2.0 Flash Thinking - В некоторых задачах превосходит GPT-4 - Даже мини-версия (Grok-3 mini) показывает конкурентные результаты Технические характеристики: - обучалась на 200,000 GPU - 10-кратное увеличение объема тренировки по сравнению с Grok 2 - Рекордный показатель ELO 1400 в Chatbot Arena - Лидирующие позиции в тестах: * AIME'24 (математика): 93% * GPQA (наука): 85% * LCB (программирование): 79% Стратегия Open Source от xAI: Компания планирует открывать код предыдущих версий после стабильного релиза новых. После полного релиза Grok 3 обещают открыть исходный код Grok 2. Ожидаемые сроки: в течение нескольких месяцев. Это интересно в контексте того, что сейчас в open-source доминируют Meta с Llama (запрещенная организация в РФ) и Mistral. Появление кода Grok может существенно изменить ландшафт открытых ИИ-моделей. Уникальные особенности: - Способность к нестандартному мышлению (попытка решить гипотезу Римана) - Эффективная работа с пространственными задачами - Улучшенные способности рассуждения при включенном режиме Thinking - Быстрая обработка и анализ научных статей. Ключевые особенности: 1. Thinking Mode: - Уникальная способность пошагового решения сложных задач - Успешно справляется с задачами, где другие модели дают сбой - Исправляет типичные ошибки базовой модели - Особенно эффективен в математических вычислениях 2. DeepSearch: - Продвинутая система поиска с перепроверкой источников - Успешно отвечает на вопросы о текущих событиях - Уровень сравним с Perplexity DeepResearch - Имеет некоторые ограничения в работе с Twitter/X - Иногда может создавать несуществующие URL Доступность: - Веб-версия на grok.com - Разрабатывается приложение SuperGrok - Планируется релиз голосового интерфейса - После стабильного релиза Grok 3 обещают открыть исходный код Grok 2 Учитывая темпы развития и уже достигнутые результаты, Grok 3 имеет все шансы стать одним из ключевых игроков на рынке ИИ. Однако, как отмечает Карпаты, необходимо дождаться более полных оценок в течение следующих недель для окончательных выводов.

Hashtags

Стартап SSI Ильи Суцкевера оценивают уже в $20млрд., идут переговоры о новых инвестициях Все это происходит на фоне того, как китайский #DeepSeek начал ломать бизнес-модели американских компаний с закрытыми ИИ-моделями. В ноябре 2024 года Илья заявил, что эра простого масштабирования ИИ закончилась. В декабре 2024 года Илья рассказал о будущем ИИ: - Появится настоящая самостоятельность в действиях - Системы научатся по-настоящему рассуждать - Их поведение станет менее предсказуемым (как у сильных шахматных программ, которые удивляют даже гроссмейстеров) - Они будут лучше учиться на небольшом количестве примеров - Разовьют понимание себя. SSI пока не генерирует выручку, но привлекает значительные инвестиции благодаря своей амбициозной миссии - разработке "безопасного суперинтеллекта", который будет превосходить человеческий интеллект, оставаясь при этом aligned (согласованным) с интересами человечества. SSI планирует выпустить свой продукт ~к 2028 году. В последний раз в сентябре 2024 стартап привлек $1 млрд при оценке в $5 млрд.

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #5668 · 01.12.2025, 12:00

✴️DeepSeek наконец проснулись и выпустили новые модели Выкатили аж две штуки: обычный V3.2 с возможностью включить/выключить мышление и V3.2 Speciale, у которого обещают лучшие ответы и тяжелый ризонинг. По бенчмаркам не плохо, подробнее: DeepSeek-V3.2 — официальный преемник V3.2-Exp, доступен в App/Web/API и позиционируется как «ежедневный драйвер» с сбалансированным инференсом и длиной ответов. DeepSeek-V3.2-Speciale — максимум рассуждений и упор на сложные задачи; сейчас только API и без tool-use, чтобы сообщество смогло нормально оценить и воспроизвести результаты. Speciale заявляет «золотой уровень» на математических и алгоритмических олимпиадах (IMO, CMO, ICPC WF, IOI-2025), а V3.2 — интегрирует «thinking» прямо в tool-use и поддерживает инструменты как в thinking-, так и в non-thinking-режимах. Важно: Speciale расходует больше токенов, но выигрывает там, где нужны глубокие цепочки рассуждений. Ссылки на модели:DeepSeek-V3.2 (Hugging Face) • DeepSeek-V3.2-Speciale (Hugging Face) 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#deepseek

ForgetMe | Нейросети

@forgetmeai · Post #5324 · 29.09.2025, 10:43

✴️DeepSeek-V3.2-Exp: новая экспериментальная модель с DSA и снижением цен на API на 50%+ DeepSeek-V3.2-Exp построена на базе V3.1-Terminus и впервые внедряет DeepSeek Sparse Attention (DSA) — разрежённую схему внимания, которая ускоряет обучение и инференс на длинном контексте при минимальном влиянии на качество. Модель уже доступна в приложении, на веб-версии и по API, а стоимость API снижена более чем на 50% — действует сразу. По бенчмаркам V3.2-Exp держится на уровне V3.1-Terminus. Для корректного сравнения V3.1-Terminus остаётся во временном API до 15 октября 2025, 15:59 (UTC) — подробности в руководстве по A/B-сравнению. Обратную связь по DSA можно оставить через форму. Доступны материалы опенсорс-релиза: модель на Hugging Face и технический отчёт (PDF). 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#deepseek

ForgetMe | Нейросети

@forgetmeai · Post #5272 · 22.09.2025, 14:10

✴️DeepSeek-V3.1-Terminus: стабильнее, чище язык, умнее агенты Обновление DeepSeek-V3.1 → V3.1-Terminus доводит сильные стороны прошлой версии и закрывает самые частые отзывы пользователей: меньше языковой «каши» и больше надёжности на бенчмарках. Что подтянули: 🟡Языковая консистентность. Снизили перемешивание CN/EN, исчезли случайные символы — ответы выглядят аккуратнее. 🟡Агенты. Усилили Code Agent и Search Agent — более точные правки кода и устойчивый поиск. 🟡Стабильность. На тестах выше надёжность и повторяемость ответов по сравнению с V3.1. Модель уже доступна в приложении, в вебе и через API. Открытые веса: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #новости#нейросети#deepseek

ForgetMe | Нейросети

@forgetmeai · Post #5149 · 04.09.2025, 15:30

✴️Bloomberg: DeepSeek готовит версию с «обучением на инструментах» По данным Bloomberg, компания DeepSeek готовит к скорому релизу модель, сфокусированную на tool use: вызовы внешних API, поиск в сети, запуск и проверка кода — всё как часть многошаговых agentic-сценариев. Подробности и точные сроки не раскрыты, но акцент на «инструментах» должен дать лучшее планирование шагов, более надёжные действия и рост пользы в реальных задачах — от исследований до автоматизации рабочих процессов. 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#deepseek

🧵 Хочешь делать видео с нейросетями, но нет $300+ на пак нейронок в месяц?Есть рабочий лайфхак! Veo2, FramePack, Runway — звучит круто, но что делать, если ты студент с дохлым ноутом и нулём на карте? Я нашёл выход для тех, кто сейчас не может себе позволить платные нейросетки. 🎒 Мне всё чаще пишут: — Где генеришь? — Какой сервис юзать вместо Runway? — Как попасть на Veo 2? — Блин чёт дорого, а есть за бесплатно? И вот что я говорю всем: 💸 Платные инструменты — лучше. У них крутое качество, настройка, скорость. Я сам за сервисы, если есть возможность. Но если её нет... 🧬Тогда смотрим на Wan 2.1 Plus. Это не замена платным нейросетям. Это — вынужденный, но рабочий вариант. Что умеет: 🦾 Бесконечные кредиты генераций 🦾 Хорошая физика объектов 🦾 Можно вставлять референсы 🦾 Дают временный доступ к редким фичам (смешивание кадров) Минусы 🕐 Долгая генерация (больше 40 мин...) #opensource | AcidCrunch

Hashtags

AI для продакта 🧠🚀

@aiforproduct · Post #574 · 29.01.2025, 11:34

☄️Сравнение ChatGPT-o1, DeepSeek и Qwen2.5-Max Провели эксперимент с тремя нейросетями - ChatGPT-o1, китайскими DeepSeek и Qwen2.5-Max. Дали им одинаковую задачу с неработающим кодом таблицы. Справились все по-разному ➡️DeepSeek удивил своим подходом – он меньше минуты выстраивал логическую цепочку рассуждений, показывая, как анализирует проблему и почему выбирает те или иные решения. Это выглядело необычно и позволило заглянуть в "процесс мышления" нейросети. После анализа он предложил конкретные блоки кода для замены. Результат получился неоднозначный: часть проблем решилась, но полностью код не исправил проблему. При повторном обращении со скринами ошибок DeepSeek сообщил о перегрузке серверов и попросил продолжить в новом чате позже. ➡️ChatGPT-o1 пошел похожим путем в начале – его первое решение тоже исправило проблему частично. Но в отличие от китайского коллеги, он смог продолжить работу после получения скринов с ошибками. Потребовалось 5 итераций, и в итоге код заработал полностью. ➡️Qwen2.5-Max. У этой модели сразу обнаружились серьезные ограничения: нельзя загружать изображения, а размер сообщения ограничен 10 000 знаками. Наш код в 50 тыс. знаков просто не поместился целиком. Несмотря на предупреждение в промпте о том, что код будет отправлен частями, Qwen2.5-Max не стал дожидаться полной картины и начал исправлять код, не видя всех функций. Результат предсказуем – решение не заработало. Технические особенности • DeepSeek: без VPN, бесплатно. Принимает и Python-файлы, и скрины ошибок одновременно с описанием задачи. Ссылки для телефона: iOS, Android • ChatGPT-o1: VPN, платно. Требуется копировать код в текст сообщения вместе со скринами • Qwen2.5-Max: без VPN. Нет поддержки изображений, жесткое ограничение на размер сообщения 🔴Думаем, что говорить о полной замене ChatGPT пока еще преждевременно. Китайские аналоги отлично себя показывают с небольшими задачами, за работу с текстами поставили пять баллов, а вот с кодом немного подкачали, отдавать серьезные задачи целиком рановато. Но безусловный их плюс - доступность из РФ. #ИИ#AI#Нейросети#DeepSeek#Qwen#ChatGPT ——— #Инструменты#LLM ✍️Подписывайтесь: @aiforproduct

🚀 DeepSeek-V3.1: Шаг в эпоху агентов! Команда DeepSeek выкатила мощнейшее обновление своей и так уже нашей любимой модели — DeepSeek-V3.1! Это именно тот шаг в эпоху AI-агентов, которого мы ждали. Как я и говорил ранее — это один из самых недооценённых ассистентов на рынке, а теперь он ещё и умнее! Главная фишка — гибридный режим Think & Non-Think: одна модель может быстро отвечать на простые вопросы или глубоко «размышлять» над сложными, идеально планируя многошаговые задачи. Невероятно полезно для автоматизации, анализа данных и работы с кодом. Для разработчиков — просто рай: поддержка 128K контекста, совместимость с Anthropic API и, что я особенно ценю, — открытые веса на Hugging Face. API стал ещё удобнее. Это не просто апдейт, а реальный прорыв. Я рад, что мои дифирамбы насчёт фундаментальной мощности и агентских скиллов DeepSeek продолжают подтверждаться. Будущее ИИ за такими проектами! Куда бежать? ➡️Скорее пробуйте: www.deepseek.com И надеюсь, адептов DeepSeek станет чуть больше... #DeepSeek#ИИ#Нейросети https://t.me/semasci

Mistral 3: мультимодальный, открытый, но... уже догоняющий Французская Mistral AI выпустила семейство моделей Mistral 3. Главное: ✅ Mistral Large 3 (41B) — мультимодальная (текст+изображение), открытая (Apache 2.0). Похожа архитектурно на DeepSeek V3. ✅Ministral (14B, 8B, 3B) — тоже мультимодальные, компактные. Но грустная правда: это не прорыв. Модель на бенчах лишь сравнивается с DeepSeek-V3.1 и Kimi K2, которые уже стали стандартом. Пока европейцы готовили релиз, в Китае вышла уже следующая итерация. Архитектурное «вдохновение» у китайских коллег и скромные результаты делают релиз скорее шагом в догоняющих. В опенсорс-гонке ИИ Китай пока уверенно рулит, задавая темп и планку. Европейский ИИ стабилен: круассаны есть, прорывов нет. #MistralAI#ИИ#Opensource#LLM https://t.me/semasci