#python#agent#agentic_ai#grpo#kimi_ai#llms#lora#qwen#qwen3#reinforcement_learning#rl
ART is a tool that helps you train smart agents for real-world tasks using reinforcement learning, especially with the GRPO method. The standout feature is RULER, which lets you skip the hard work of designing reward functions by using a large language model to automatically score how well your agent is doing—just describe your task, and RULER takes care of the rest. This makes building and improving agents much faster and easier, works for any task, and often performs as well as or better than hand-crafted rewards. You can install ART with a simple command and start training agents right away, even on your own computer or with cloud resources.
https://github.com/OpenPipe/ART
Казахстанские олимпийцы 10 февраля: итог выступлений и результаты
Сборная Казахстана выступала на Олимпиаде‑2026 в Италии в пяти видах спорта. В лыжном спринте классическим стилем 7 казахстанцев не прошли квалификацию. В шорт‑треке на дистанциях 500 м и 1000 м Яна Хан, Ольга Тихонова и Денис Никиша завершили участие на предварительных этапах.
В фристайле‑могуле Павел Колмаков набрал 76,24 балла и занял 9‑е место после первой квалификации, выйдя в финал. Женские могулистки — Анастасия Городко (70,98, 12‑е место), Юлия Галышева (69,60, 14‑е) и Аяулым Амренова (63,50, 20‑е) — получили шанс в следующем раунде квалификации.
В фигурном катании среди мужчин Михаил Шайдоров в короткой программе набрал 92,94 балла (https://www.championat.com/figureskating/_otherfigureskating/tournament/1050/match/81074/#stats) и расположился в первой десятке.
Команда Казахстана завершила день без медалей, но с выходом одного спортсмена в финал и достойным выступлением в фигурном катании.
#stats
#TIL# I learned about this interesting concept called martingale.
> ... at a particular time, the conditional expectation of the next value in the sequence is equal to the present value, regardless of all prior values.
https://en.wikipedia.org/wiki/Martingale_(probability_theory)
The value transferred with the help of stablecoins in August exceeded $ 110 billion.
For four months in a row, the indicator renews its maximum, and a year ago it was five times less.
#stats