«DeepSeek»: как порвать рынок нейросетей
Всего одна китайская нейросеть умудрилась обрушить не только весь мировой рынок нейросетей, но и фондовый рынок США.
Китайцы собрали простую и дешевую сеть «DeepSeek», которая оказалась гораздо эффективнее, чем «ChatGPT». Нюанс в том, что ChatGPT ориентирован на экстенсивное развитие, то есть на наращивание вычислительных мощностей нейросети. DeepSeek же основывается на более современных алгоритмах и принципиально новом подходе к разработке нейросетей.
Грубо говоря, там, где все технологические гиганты просто добавляли всё новые и новые процессорные блоки, разработчики DeepSeek сели и подумали, как сделать лучше программным способом. И сделали.
Основной плюс DeepSeek – он бесплатен. Он работает быстрее, лучше и надёжнее, чем ChatGPT, на который уже потратили сотни миллионов долларов. У него нет так называемых «галлюцинаций», то есть заведомо ложных и несуществующих выводов.
По данным анализа ведущих экспертов, DeepSeek использует на 75% меньше памяти в сравнении с основными конкурирующими нейросетями, и использует систему мультитокенов, позволяющую анализировать фразы целиком. В DeepSeek реализована модель специализированных экспертов и параметров, которые «включаются» только по мере необходимости. Как следствие, система может работать не на дорогостоящих серверных платформах, а на обычных игровых компьютерах, а стоимость её API на 95% дешевле, чем у ChatGPT.
По факту DeepSeek «одной левой» сломала всю отлаженную «западную» схему по превращению искусственного интеллекта в деньги, по которой якобы «только крупные tech-компании могут играть в ИИ». Оказывается, нет. И за короткий срок DeepSeek стал самым популярным бесплатным приложением в Apple App Store в США, обойдя ChatGPT.
Ну и вишенка на торте. Код DeepSeek публичный. Техническая документация находится в открытом доступе. Каждый человек может купить мощный компьютер и сделать себе свой собственный DeepSeek. Это не революция — это крупнейший прорыв в сфере ИТ со времён изобретения персонального компьютера, который «убил» мейнфреймы.
На фоне успехов DeepSeek в мире началась настоящая нейросетевая лихорадка, тут же перекинувшаяся на биржи. Только за сутки акции технологических гигантов, в первую очередь Nvidia, рухнул на несколько процентов, а это примерно триллион долларов. Вся бизнес-модель ИТ-гигантов была построена на принципе продажи супердорогих GPU (Graphics Processing Unit) с маржой 90%. Теперь оказалось, что эти GPU просто не нужны.
В ответ DeepSeek подвёргся масштабным кибератакам. В течение 28 января в сервисе было невозможно зарегистрироваться, десктопная версия нейросети не отвечал на запросы, хотя и загружалась.
Что дальше?
OpenAI, Anthropic и Nvidia просели, но не убиты. Само собой, они сделают выводы, переформатируют бизнес и выведут на рынок, вероятнее всего, бесплатные нейросети. А деньги будут зарабатывать на том же, на чём их зарабатывают поисковые системы: на анализа запросов пользователей и продаже этого анализа коммерсантам, то есть на формировании маркетинговых стратегий. Рано или поздно это должно было случиться — но этот момент все изо всех сил оттягивали.
Кстати, только в январе 2025 года Китай обошёл «Starlink» со своим проектом «Chang Guang Satellite Technology», достигнув скорости передачи данных со спутника на Землю в 100 гигабит в секунду. А китайская тороидальная установка для магнитного удержания плазмы с целью достижения условий, необходимых для протекания управляемого термоядерного синтеза (токамак) «EAST» смогла добиться поддержания температуры свыше 100 миллионов градусов в течение 1066 секунд, побив свой собственный предыдущий рекорд в 403 секунды. На основе подобного токамака будут создаваться плазменные электростанции, которые смогут давать практически бесплатную электроэнергию в неограниченных масштабах.
#ai#ии#deepseek
🚀 DeepSeek-V3.1: Шаг в эпоху агентов!
Команда DeepSeek выкатила мощнейшее обновление своей и так уже нашей любимой модели — DeepSeek-V3.1! Это именно тот шаг в эпоху AI-агентов, которого мы ждали.
Как я и говорил ранее — это один из самых недооценённых ассистентов на рынке, а теперь он ещё и умнее! Главная фишка — гибридный режим Think & Non-Think: одна модель может быстро отвечать на простые вопросы или глубоко «размышлять» над сложными, идеально планируя многошаговые задачи. Невероятно полезно для автоматизации, анализа данных и работы с кодом.
Для разработчиков — просто рай: поддержка 128K контекста, совместимость с Anthropic API и, что я особенно ценю, — открытые веса на Hugging Face. API стал ещё удобнее.
Это не просто апдейт, а реальный прорыв. Я рад, что мои дифирамбы насчёт фундаментальной мощности и агентских скиллов DeepSeek продолжают подтверждаться. Будущее ИИ за такими проектами!
Куда бежать? ➡️Скорее пробуйте: www.deepseek.com
И надеюсь, адептов DeepSeek станет чуть больше...
#DeepSeek#ИИ#Нейросети
https://t.me/semasci
Компания Маска xAI представила новую ИИ-модель Grok 3, которая превосходит #DeepSeek R1 и на уровне o1-pro от OpenAI за $200/месяц
Всего за 1 год работы xAI удалось создать модель, конкурирующую с лидерами индустрии. Особенно впечатляет скорость развития и внедрение инновационных подходов, таких как режим Thinking. При этом команда продолжает активную работу над улучшением модели, обещая регулярные обновления.
Сравнение с конкурентами:
- Сопоставим по возможностям с o1-pro от OpenAI ($200/месяц)
- Превосходит DeepSeek-R1 и Gemini 2.0 Flash Thinking
- В некоторых задачах превосходит GPT-4
- Даже мини-версия (Grok-3 mini) показывает конкурентные результаты
Технические характеристики:
- обучалась на 200,000 GPU
- 10-кратное увеличение объема тренировки по сравнению с Grok 2
- Рекордный показатель ELO 1400 в Chatbot Arena
- Лидирующие позиции в тестах:
* AIME'24 (математика): 93%
* GPQA (наука): 85%
* LCB (программирование): 79%
Стратегия Open Source от xAI:
Компания планирует открывать код предыдущих версий после стабильного релиза новых. После полного релиза Grok 3 обещают открыть исходный код Grok 2. Ожидаемые сроки: в течение нескольких месяцев.
Это интересно в контексте того, что сейчас в open-source доминируют Meta с Llama (запрещенная организация в РФ) и Mistral. Появление кода Grok может существенно изменить ландшафт открытых ИИ-моделей.
Уникальные особенности:
- Способность к нестандартному мышлению (попытка решить гипотезу Римана)
- Эффективная работа с пространственными задачами
- Улучшенные способности рассуждения при включенном режиме Thinking
- Быстрая обработка и анализ научных статей.
Ключевые особенности:
1. Thinking Mode:
- Уникальная способность пошагового решения сложных задач
- Успешно справляется с задачами, где другие модели дают сбой
- Исправляет типичные ошибки базовой модели
- Особенно эффективен в математических вычислениях
2. DeepSearch:
- Продвинутая система поиска с перепроверкой источников
- Успешно отвечает на вопросы о текущих событиях
- Уровень сравним с Perplexity DeepResearch
- Имеет некоторые ограничения в работе с Twitter/X
- Иногда может создавать несуществующие URL
Доступность:
- Веб-версия на grok.com
- Разрабатывается приложение SuperGrok
- Планируется релиз голосового интерфейса
- После стабильного релиза Grok 3 обещают открыть исходный код Grok 2
Учитывая темпы развития и уже достигнутые результаты, Grok 3 имеет все шансы стать одним из ключевых игроков на рынке ИИ. Однако, как отмечает Карпаты, необходимо дождаться более полных оценок в течение следующих недель для окончательных выводов.
Стартап SSI Ильи Суцкевера оценивают уже в $20млрд., идут переговоры о новых инвестициях
Все это происходит на фоне того, как китайский #DeepSeek начал ломать бизнес-модели американских компаний с закрытыми ИИ-моделями.
В ноябре 2024 года Илья заявил, что эра простого масштабирования ИИ закончилась.
В декабре 2024 года Илья рассказал о будущем ИИ:
- Появится настоящая самостоятельность в действиях
- Системы научатся по-настоящему рассуждать
- Их поведение станет менее предсказуемым (как у сильных шахматных программ, которые удивляют даже гроссмейстеров)
- Они будут лучше учиться на небольшом количестве примеров
- Разовьют понимание себя.
SSI пока не генерирует выручку, но привлекает значительные инвестиции благодаря своей амбициозной миссии - разработке "безопасного суперинтеллекта", который будет превосходить человеческий интеллект, оставаясь при этом aligned (согласованным) с интересами человечества.
SSI планирует выпустить свой продукт ~к 2028 году.
В последний раз в сентябре 2024 стартап привлек $1 млрд при оценке в $5 млрд.
✴️DeepSeek наконец проснулись и выпустили новые модели
Выкатили аж две штуки: обычный V3.2 с возможностью включить/выключить мышление и V3.2 Speciale, у которого обещают лучшие ответы и тяжелый ризонинг. По бенчмаркам не плохо, подробнее:
DeepSeek-V3.2 — официальный преемник V3.2-Exp, доступен в App/Web/API и позиционируется как «ежедневный драйвер» с сбалансированным инференсом и длиной ответов. DeepSeek-V3.2-Speciale — максимум рассуждений и упор на сложные задачи; сейчас только API и без tool-use, чтобы сообщество смогло нормально оценить и воспроизвести результаты.
Speciale заявляет «золотой уровень» на математических и алгоритмических олимпиадах (IMO, CMO, ICPC WF, IOI-2025), а V3.2 — интегрирует «thinking» прямо в tool-use и поддерживает инструменты как в thinking-, так и в non-thinking-режимах. Важно: Speciale расходует больше токенов, но выигрывает там, где нужны глубокие цепочки рассуждений.
Ссылки на модели:DeepSeek-V3.2 (Hugging Face) • DeepSeek-V3.2-Speciale (Hugging Face)
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#deepseek
✴️DeepSeek-V3.2-Exp: новая экспериментальная модель с DSA и снижением цен на API на 50%+
DeepSeek-V3.2-Exp построена на базе V3.1-Terminus и впервые внедряет DeepSeek Sparse Attention (DSA) — разрежённую схему внимания, которая ускоряет обучение и инференс на длинном контексте при минимальном влиянии на качество. Модель уже доступна в приложении, на веб-версии и по API, а стоимость API снижена более чем на 50% — действует сразу.
По бенчмаркам V3.2-Exp держится на уровне V3.1-Terminus. Для корректного сравнения V3.1-Terminus остаётся во временном API до 15 октября 2025, 15:59 (UTC) — подробности в руководстве по A/B-сравнению. Обратную связь по DSA можно оставить через форму. Доступны материалы опенсорс-релиза: модель на Hugging Face и технический отчёт (PDF).
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#deepseek
✴️DeepSeek-V3.1-Terminus: стабильнее, чище язык, умнее агенты
Обновление DeepSeek-V3.1 → V3.1-Terminus доводит сильные стороны прошлой версии и закрывает самые частые отзывы пользователей: меньше языковой «каши» и больше надёжности на бенчмарках.
Что подтянули:
🟡Языковая консистентность. Снизили перемешивание CN/EN, исчезли случайные символы — ответы выглядят аккуратнее.
🟡Агенты. Усилили Code Agent и Search Agent — более точные правки кода и устойчивый поиск.
🟡Стабильность. На тестах выше надёжность и повторяемость ответов по сравнению с V3.1.
Модель уже доступна в приложении, в вебе и через API.
Открытые веса: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#новости#нейросети#deepseek
✴️Bloomberg: DeepSeek готовит версию с «обучением на инструментах»
По данным Bloomberg, компания DeepSeek готовит к скорому релизу модель, сфокусированную на tool use: вызовы внешних API, поиск в сети, запуск и проверка кода — всё как часть многошаговых agentic-сценариев.
Подробности и точные сроки не раскрыты, но акцент на «инструментах» должен дать лучшее планирование шагов, более надёжные действия и рост пользы в реальных задачах — от исследований до автоматизации рабочих процессов.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#deepseek
🔥 На всех площадках! "Шашков & Головко" запустились в YouTube, Дзен, Rutube и ВК!
Показываем, как использовать ИИ для повышения личной эффективности. Никакой воды – только работающие инструменты и реальные результаты.
Стримы в ТГ, их записи на YouTube и Rutube, а развернутые разборы кейсов – в Дзене.
А теперь к вам! Какие задачи хочется автоматизировать, но всё руки не доходят разобраться? Делитесь в комментариях – сделаем классный контент именно под ваши запросы!
✔️ Присоединяйтесь к нам на всех площадках:
YouTube
Дзен
Rutube
ВК
Будет полезно и интересно!
#ИИ#AI#Нейросети
———
#События
✍️Подписывайтесь: @aiforproduct
✴️DeepSeek выкатила V4 Preview с контекстом в 1 миллион токенов
DeepSeek открыла preview-линейку V4 и сразу выложила open weights. В серии две MoE-модели: DeepSeek-V4-Pro с 1,6 трлн параметров и 49 млрд активных и DeepSeek-V4-Flash с 284 млрд параметров и 13 млрд активных. Обе модели поддерживают контекст до 1M токенов, режимы thinking / non-thinking и уже доступны как в веб-интерфейсе DeepSeek, так и через API.
Главный акцент релиза — длинный контекст и агентные задачи. DeepSeek пишет про новую схему внимания с token-wise compression и DeepSeek Sparse Attention, а V4-Pro подает как open-source флагман для reasoning, coding и agentic-сценариев. V4-Flash — более быстрый и дешевый вариант, который при этом тоже умеет работать с 1M контекстом и подходит для повседневных задач. Отдельно компания заявляет интеграцию V4 с агентными инструментами вроде Claude Code, OpenClaw и OpenCode.
В API достаточно просто сменить имя модели на deepseek-v4-pro или deepseek-v4-flash. При этом deepseek-chat и deepseek-reasoner DeepSeek собирается полностью отключить 24 июля 2026 года в 15:59 UTC — сейчас эти маршруты уже фактически ведут на V4-Flash в обычном и thinking-режимах.
Источники: Tech Report | Open Weights | API Docs
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#deepseek
👀DeepSeek «добавил» генерацию изображений… но не совсем
В App Store для DeepSeek указано, что в версии 1.3.0 появилась поддержка создания изображений из диалогов, улучшен выбор и копирование текста, а также исправлены баги.
Но в реальном приложении функция генерации изображений пока не работает. Похоже, её либо откатили, либо включат позже — возможно, в рамках подготовки к запуску новой модели.
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#нейросети#deepseek