«DeepSeek»: как порвать рынок нейросетей
Всего одна китайская нейросеть умудрилась обрушить не только весь мировой рынок нейросетей, но и фондовый рынок США.
Китайцы собрали простую и дешевую сеть «DeepSeek», которая оказалась гораздо эффективнее, чем «ChatGPT». Нюанс в том, что ChatGPT ориентирован на экстенсивное развитие, то есть на наращивание вычислительных мощностей нейросети. DeepSeek же основывается на более современных алгоритмах и принципиально новом подходе к разработке нейросетей.
Грубо говоря, там, где все технологические гиганты просто добавляли всё новые и новые процессорные блоки, разработчики DeepSeek сели и подумали, как сделать лучше программным способом. И сделали.
Основной плюс DeepSeek – он бесплатен. Он работает быстрее, лучше и надёжнее, чем ChatGPT, на который уже потратили сотни миллионов долларов. У него нет так называемых «галлюцинаций», то есть заведомо ложных и несуществующих выводов.
По данным анализа ведущих экспертов, DeepSeek использует на 75% меньше памяти в сравнении с основными конкурирующими нейросетями, и использует систему мультитокенов, позволяющую анализировать фразы целиком. В DeepSeek реализована модель специализированных экспертов и параметров, которые «включаются» только по мере необходимости. Как следствие, система может работать не на дорогостоящих серверных платформах, а на обычных игровых компьютерах, а стоимость её API на 95% дешевле, чем у ChatGPT.
По факту DeepSeek «одной левой» сломала всю отлаженную «западную» схему по превращению искусственного интеллекта в деньги, по которой якобы «только крупные tech-компании могут играть в ИИ». Оказывается, нет. И за короткий срок DeepSeek стал самым популярным бесплатным приложением в Apple App Store в США, обойдя ChatGPT.
Ну и вишенка на торте. Код DeepSeek публичный. Техническая документация находится в открытом доступе. Каждый человек может купить мощный компьютер и сделать себе свой собственный DeepSeek. Это не революция — это крупнейший прорыв в сфере ИТ со времён изобретения персонального компьютера, который «убил» мейнфреймы.
На фоне успехов DeepSeek в мире началась настоящая нейросетевая лихорадка, тут же перекинувшаяся на биржи. Только за сутки акции технологических гигантов, в первую очередь Nvidia, рухнул на несколько процентов, а это примерно триллион долларов. Вся бизнес-модель ИТ-гигантов была построена на принципе продажи супердорогих GPU (Graphics Processing Unit) с маржой 90%. Теперь оказалось, что эти GPU просто не нужны.
В ответ DeepSeek подвёргся масштабным кибератакам. В течение 28 января в сервисе было невозможно зарегистрироваться, десктопная версия нейросети не отвечал на запросы, хотя и загружалась.
Что дальше?
OpenAI, Anthropic и Nvidia просели, но не убиты. Само собой, они сделают выводы, переформатируют бизнес и выведут на рынок, вероятнее всего, бесплатные нейросети. А деньги будут зарабатывать на том же, на чём их зарабатывают поисковые системы: на анализа запросов пользователей и продаже этого анализа коммерсантам, то есть на формировании маркетинговых стратегий. Рано или поздно это должно было случиться — но этот момент все изо всех сил оттягивали.
Кстати, только в январе 2025 года Китай обошёл «Starlink» со своим проектом «Chang Guang Satellite Technology», достигнув скорости передачи данных со спутника на Землю в 100 гигабит в секунду. А китайская тороидальная установка для магнитного удержания плазмы с целью достижения условий, необходимых для протекания управляемого термоядерного синтеза (токамак) «EAST» смогла добиться поддержания температуры свыше 100 миллионов градусов в течение 1066 секунд, побив свой собственный предыдущий рекорд в 403 секунды. На основе подобного токамака будут создаваться плазменные электростанции, которые смогут давать практически бесплатную электроэнергию в неограниченных масштабах.
#ai#ии#deepseek
🖌️ Управляемое изменение изображений с помощью DragGAN
В создании визуального контента, который отвечает нуждам пользователя, часто требуется гибкое и точное управление позой, формой, выражением и компоновкой сгенерированных объектов. В данной работе исследуется более эффективный и малоизученный способ управления GAN, позволяющий "перетаскивать" любые точки изображения для точного достижения целевых точек в интерактивном режиме. Для этого предлагается DragGAN, состоящий из двух основных компонентов: 1) контроль движения на основе признаков, который направляет контрольную точку к целевой позиции, и 2) новый подход к отслеживанию точек, использующий дискриминативные признаки GAN для определения позиции контрольных точек.
С помощью DragGAN, любой может деформировать изображение с точным контролем над перемещением пикселей, тем самым меняя позу, форму, выражение и компоновку различных категорий, таких как животные, автомобили, люди, пейзажи и т.д. Поскольку эти манипуляции выполняются на обученном генеративном изображении GAN, они способны создавать реалистичные результаты даже в сложных сценариях, таких как воссоздание закрытого контента и деформация форм, которые последовательно следуют за жесткостью объекта.
🔗 Website: https://vcai.mpi-inf.mpg.de/projects/DragGAN/
📝 Paper: https://vcai.mpi-inf.mpg.de/projects/DragGAN/data/paper.pdf
🧪 Demo: https://huggingface.co/spaces/radames/DragGan
👨💻 Github: https://github.com/XingangPan/DragGAN
#ai#gan#image
Что лучше работает Prompting или Finetunning?
Размышления Andrej Karpathy на тему сравнения prompting (включая embeddings) и finetuning для обучения LLMs (Large Language Model). Вот что он говорит о разных моментах этого процесса:
1. Zero-shot prompting (решение задач без примеров) - это когда модель решает задачу без предоставления примеров решений, опираясь исключительно на свои эмбеддинги.
2. Few-shot prompting (решение задач с несколькими примерами) - это когда модель получает небольшое количество примеров прежде, чем решать задачу, используя свои эмбеддинги в сочетании с предоставленными примерами.
3. Finetuning (дообучение) - процесс обучения модели на основе конкретных примеров и данных, чтобы улучшить ее способности в решении задач, адаптируя эмбеддинги и параметры модели.
В контексте сравнения prompting и finetuning становится ясно, что достижение высокой точности в решении множества задач, применяя только zero-shot или few-shot prompting, - это замечательно (подкладывать примеры как preprompt). Однако для достижения наилучших результатов необходимо применять finetuning, особенно когда речь идет о конкретных, четко определенных задачах, и доступно много данных для обучения.
Стоит учесть, что маленькие модели, в отличие от больших, практически не в состоянии обучаться при помощи zero-shot или few-shot prompting, но их все равно можно настроить с тщательным выбором сложности задачи и методов решения.
#ai#prompting#finetunning
😮 Yangi neyron tarmoq videolarni inson kabi “suratga oladi”
🇨🇳 Xitoyliklar Seedance 2.0 modelini taqdim etdi va uning imkoniyatlari hayratlanarli:
· bitta promptdan to‘liq qisqa metrajli film yaratish;
· 8 tilda ideal lipsink;
· RayFlow optimizatsiyasi tufayli tez generatsiya;
· 1080p tasvir sifati;
· ortiqcha qo‘l-oyoqlar yoki “matritsa baglari” yo‘q;
· jang sahnalari va kino uslubida kamera harakati;
· yetakchi animatsiya studiyalari darajasida multfilm generatsiyasi.
🧑💻 AI’ga erta kirish imkoniyatini olgan kontent-meykerlar katta hayajon bilan fikr bildirmoqda — bu instrument Kling 3.0 va Sora 2 aralashmasiga o‘xshaydi.
✅ O‘zingiz ham “Gollivud” kontentini shu yerda yaratib ko‘ring.
➡️#ai#seedance | Birinchi IT-Blog
🔥Представили Firebase Studio — AI-агент среда на основе Gemini.
Что позволяет инструмент:
👉 Прототипировать проекты на множестве языков программирования
👉 Быстро изменять код проекта через коммуникацию в AI-чате
👉 Переходить и просматривать код проекта в любой момент
👉 Проверять, как будет выглядеть ваш прототип, через генерацию публичной ссылки на веб-превью
👉 Быстрая публикация с помощью Firebase App Hosting
👉 Совместная работа над проектом в реальном времени
В будущем появятся агенты Gemini Code Assist для расширения возможностей.
#firebase#ai#gemini
Turli sohalar uchun bir qancha foydali saytlar
#manba / #AI / #instagram
▪️Contentdrips - sayt Instagram uchun "карусель" post yaratish uchun tayyor shablonlar beradi. Siz ularni tahrirlab, yuklab olishingiz mumkin.
▪️Desygner - bu har qanday maket va dizaynlarni yaratish uchun qulay va bepul onlayn muharrir. Masalan, bu yerda ijtimoiy tarmoqlar uchun dizayn yaratish, tashrif qog'ozi, avatarlar va boshqalarni tayyorlash mumkin.
▪️Diagrams.net - turli ko'rinishdagi diagrammalar yasash uchun, to'g'ridan-to'g'ri tushuntirishlar olib borish uchun va boshqa shu kabi maqsadlarda foydalanish uchun ajoyib sayt.
💻 Kompyuterni birga o'rganamiz ⤵️
TelegramIInstagramITikTok