TGTGInsighttelegram intelligenceLIVE / telegram public index
← Mathshub: интенсив по математике и Python (aug '22)

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonmathaug22 · Post #33 · 19 сеп.

❗️ВАЖНО❗️ 🎾Обратная связь по четвертой неделе интенсива Оставить отзыв на занятия прошлой недели 12 и 15 сентября можно по ссылке: https://forms.gle/HCXZb1B8q77FoGDy8 🎾Обновления в домашних заданиях В домашней работе №3: – исправили ответы на вопросы №2 и №7 – добавили дополнительные 2 попытки, чтобы вы могли снова выполнить откорректированный тест (итого 5 разрешенных попыток) – продлили дедлайн до 24 сентября 23:59 (мск) В домашней работе №4: – поправили прием ответа на вопрос №12 (ранее у некоторых студентов возникали трудности) – добавили дополнительные 2 попытки, чтобы вы могли снова выполнить откорректированный тест (итого 5 разрешенных попыток) – дедлайн остается тем же: 30 сентября 23:59 (мск) 🎾 У меня возникают разные вопросы по задачам — к кому обратиться? К хелперам в Discord-комьюнити: мы раздали роль helpers тем, кто готов помогать начинающим с нуля. Хелперы отображаются красным цветом. Создали 10 мини-групп с 2-3 хелперами в каждой. В ближайшее время начнем распределять по мини-группам студентов, которые оставили реакции под постом о наборе в мини-группы начинающих. Этот пост находится в последнем закрепленном сообщении на канале #python-и-математика: реакции все еще можно оставить, если вы хотите в мини-группу. Хорошей недели! Команда Mathshub

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #smallmodel

当前筛选 #smallmodel清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8975 · 12.11.2025 г., 13:03

⭐VibeThinker-1.5B - миниатюрная модель, которая показывает SOTA-результаты в задачах рассуждения. 🚀Производительность: одна из лучших на AIME24/25 и HMMT25 - превосходит DeepSeek R1-0120 по математическим задачам и опережает модели такого же размера в соревновательном программировании. ⚡Эффективность: всего 1.5B параметров. то есть в 100–600 раз меньше, чем гиганты вроде Kimi K2 и DeepSeek R1. 💰Стоимость: полный пост-тренинг обошёлся всего в $7.8K, примерно в 30–60 раз дешевле, чем у DeepSeek R1 или MiniMax-M1. Модель основана на Spectrum-to-Signal Principle (SSP) и MGPO-фреймворке, оптимизирующих процесс рассуждения. 📦Model:https://huggingface.co/WeiboAI/VibeThinker-1.5B 💻GitHub:https://github.com/WeiboAI/VibeThinker 📄Arxiv:https://arxiv.org/abs/2511.06221 @ai_machinelearning_big_data #AI#LLM#Reasoning#OpenSource#SmallModel