TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15539 · Mar 5

#python#agent#llm#llm_agent#llm_reasoning#machine_learning_systems#mlsys#reinforcement_learning#rl AReaL is a free, open-source system for fast asynchronous reinforcement learning to train large AI models in math, coding, search, and agents. It decouples generation and training for up to 2.77x speedup, stable performance, and easy setup on single or 1000+ GPUs with algorithms like GRPO/PPO. Install via git/pip, run examples like GSM8K math instantly. You benefit by building top AI agents affordably and quickly, reproducing results with shared data/models, saving time/money vs. slow synchronous tools. https://github.com/inclusionAI/AReaL

Results

1 similar post found

Search: #livecodebench

当前筛选 #livecodebench清除筛选
Семён: Нейросети в каждый дом

@semasci · Post #1187 · 07/01/2025, 05:36 AM

DeepSeek R2: Ожидание затягивается.. ⏳ Ждали в апреле-мае релиза DeepSeek R2 (наш пост от апреля)? преемника невероятно популярной модели R1, обещавшего революцию в кодинге и неанглоязычных рассуждениях. Но, похоже, придется подождать дольше. Что случилось? Гендиректор DeepSeek Лян Вэньфэн недоволен результатами R2: модель пока не соответствует внутренним стандартам качества компании и сроки релиза снова не определены. Технические сложности: Быстрому запуску могут помешать не только требования к качеству, но и острая нехватка серверных чипов Nvidia в Китае из-за американских санкций. Облачные провайдеры опасаются, что спрос на мощную R2 может превысить их текущие возможности. Почему R2 так ждут? Потому что R1 – настоящий феномен! ➡️Майское обновление R1 (R1-0528) показало феноменальный прогресс в генерации кода! По данным LiveCodeBench, она вплотную приблизилась к топовым моделям OpenAI и обошла Grok 3 mini и Qwen 3! ➡️В феврале DeepSeek Chat привлек 524.7 млн посещений, обогнав ChatGPT и став самым быстрорастущим ИИ-инструментом в мире с долей рынка 12.12%! ➡️Пока DeepSeek шлифует R2, Илон Маск анонсировал релиз Grok 4 "вскоре после 4 июля" (ранее известная как Grok 3.5). Что это значит? DeepSeek явно не хочет выпускать "сырой" продукт, особенно на фоне успеха R1 и растущей конкуренции. Они стремятся сделать R2 по-настоящему прорывной. Однако задержки и проблемы с "железом" (чипы Nvidia) добавляют неопределенности. Ждать ли нам R2 этим летом? Или осенью? Делитесь мнениями в комментариях! #DeepSeek#DeepSeekR2#DeepSeekR1#ИскусственныйИнтеллект#ИИ#AI#Китай#Nvidia#Чипы#Reuters#TheInformation#Grok4#xAI#LiveCodeBench#Нейросети#БольшиеЯзыковыеМодели#LLM#NvidiaH100#Санкции https://t.me/semasci