TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #403 · 31 дек.

С Новым Годом!🎄☃️❄️ Снова этот рубеж подведения итогов и определения планов на следующее 365 дней. Что же мы успели застать в 2к25? 🔸 AI снова делает скачёк в развитии, как по качеству, так и по затратам на ресурсы Продолжая расшатывать все рынки 🔸 Эпичный прорыв цен на железо (из-за первого факта). Сначала оперативка, потом и остальные подтянулись. Успели закупиться вовремя? 🔸 Новый виток "борьбы с интернетом" в РФ Работать всё сложней 🔸 Опенсорсный проект MinIO закрылся Теперь только в облаке и только за денежку Но не всё так плохо! 🔸 Всё больше уверенных мнений, что AI нас не заменит Но всем нужно адаптироваться к новым реалиям и инструментам 🔸 uv ворвался в прод Так и стандартом станет скоро 🔸 Вышел Django 6 Достаточно ли изменений для мажорной версии? 🔸 Вышел PIthon 3.14 с NO-GIL режимом Раньше это считалось невозможным! 🔸 В том же 3.14 мы получили полноценные Субинтерпретаторы и JIT И другие оптимизации 🔸 Язык Rust теперь официально второй язык ядра Linux Хоть и не без проблем 🔸 Проекту pythonotes 6 лет 🎂 Скоро в школу) Мир вокруг меняется постоянно и всё с большей скоростью. Не ищите виновных, просто адаптируйтесь и постоянно учитесь. И всё будет пучком! 😎 Оглядываясь назад в прошлое, задумайтесь, можете ли вы сказать тому себе из прошлого СПАСИБО за то, что вы имеете в настоящем? И хорошенько подумайте в этом настоящем, что нужно делать уже сейчас, чтобы вы из будущего стали лучшей версией себя настоящего и гордились своей версией из прошлого за заботу о будущем. Sir Christopher Edward Nolan :) #offtop

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #grpo

当前筛选 #grpo清除筛选
GitHub Trends

@githubtrending · Post #14958 · 14.07.2025 г., 12:30

#python#agent#agentic_ai#grpo#kimi_ai#llms#lora#qwen#qwen3#reinforcement_learning#rl ART is a tool that helps you train smart agents for real-world tasks using reinforcement learning, especially with the GRPO method. The standout feature is RULER, which lets you skip the hard work of designing reward functions by using a large language model to automatically score how well your agent is doing—just describe your task, and RULER takes care of the rest. This makes building and improving agents much faster and easier, works for any task, and often performs as well as or better than hand-crafted rewards. You can install ART with a simple command and start training agents right away, even on your own computer or with cloud resources. https://github.com/OpenPipe/ART