TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #582 · 2.10

Сегодня не было событий, которыми я хочу поделиться, поэтому расскажу историю из жизни. В университете у нас был русский язык. Это неожиданно — русский язык в техническом вузе на хардкорной технической специальности. Тем не менее, на мой взгляд он был не лишним, и некоторое количество новых знаний добавил. Как-то раз преподаватель — серьезная строгая женщина — спросила, знает ли кто-нибудь в группе, что такое «компиляция». Я тогда уже вовсю увлекался программированием, и подумал, что вот он: мой час славы. Наконец-то я использую свои знания по программированию! Тогда я поднял руку и ответил: «Преобразование исходного кода программы в исполняемый файл». Я надеялся быть оценённым за это знание, но к своему удивлению увидел разочарование и неудовольствие на лице преподавательницы. «Нет», — сказала она так, будто бы я своё определение выдумал, — «Это собрание информации из разных источников в одну работу». Мораль: если вас не оценили по достоинству, то проблема не обязательно в вас самих. Просто не все люди обладают достаточными знаниями для такой оценки. #life

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #smallmodel

当前筛选 #smallmodel清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8975 · 12.11.2025 г., 13:03

⭐VibeThinker-1.5B - миниатюрная модель, которая показывает SOTA-результаты в задачах рассуждения. 🚀Производительность: одна из лучших на AIME24/25 и HMMT25 - превосходит DeepSeek R1-0120 по математическим задачам и опережает модели такого же размера в соревновательном программировании. ⚡Эффективность: всего 1.5B параметров. то есть в 100–600 раз меньше, чем гиганты вроде Kimi K2 и DeepSeek R1. 💰Стоимость: полный пост-тренинг обошёлся всего в $7.8K, примерно в 30–60 раз дешевле, чем у DeepSeek R1 или MiniMax-M1. Модель основана на Spectrum-to-Signal Principle (SSP) и MGPO-фреймворке, оптимизирующих процесс рассуждения. 📦Model:https://huggingface.co/WeiboAI/VibeThinker-1.5B 💻GitHub:https://github.com/WeiboAI/VibeThinker 📄Arxiv:https://arxiv.org/abs/2511.06221 @ai_machinelearning_big_data #AI#LLM#Reasoning#OpenSource#SmallModel