#python#agent#agentic_ai#grpo#kimi_ai#llms#lora#qwen#qwen3#reinforcement_learning#rl
ART is a tool that helps you train smart agents for real-world tasks using reinforcement learning, especially with the GRPO method. The standout feature is RULER, which lets you skip the hard work of designing reward functions by using a large language model to automatically score how well your agent is doing—just describe your task, and RULER takes care of the rest. This makes building and improving agents much faster and easier, works for any task, and often performs as well as or better than hand-crafted rewards. You can install ART with a simple command and start training agents right away, even on your own computer or with cloud resources.
https://github.com/OpenPipe/ART
Вот такой интересный анонс мне в личку прислали
18+ НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН, РАСПРОСТРАНЕН И (ИЛИ) НАПРАВЛЕН ИНОСТРАННЫМ АГЕНТОМ КАВКАЗСКИМ НИКОЛАЕМ ЮРЬЕВИЧЕМ ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА КАВКАЗСКОГО НИКОЛАЯ ЮРЬЕВИЧА
Федивёрс: понятное погружение в федеративные сети
Федивёрс — экосистема совместимых соцсетей. На первый взгляд она непривычна, но в оффлайне первые шаги делаются проще.
27 сентября (суббота), 17:00, метро Курская.
Наш семинар по информационной безопасности это отличная возможность попробовать что-то действительно интересное. Присоединяйтесь к нам, чтобы узнать больше о Fediverse и его уникальных особенностях!
О чём говорим и что делаем:
Что такое Fediverse?
Простые принципы работы и как сервисы “видят” друг друга.
Как это устроено для пользователя?
Посты, подписки, хэштеги и общение между разными серверами.
Какие проблемы решает структура Fediverse?
Альтернатива централизации: контроль над лентой, переносимость, отсутствие рекламы.
Почему жизнь без алгоритмов — то, что стоит попробовать?
Больше внимания к людям, меньше манипуляций и «скролл-ловушек».
Модерация и свобода слова.
Разные правила на разных серверах; как находить «свой» по ценностям. CW/предупреждения как норма заботы.
Базовая безопасность в федеративных сетях.
Приватность по шагам: профили, видимость, сообщения, «следы».
Как сеть живёт без алгоритмов?
Роль хэштегов, локальных сообществ и ручной подписки; как быстро стартовать.
Практика прямо на месте (по желанию):
😍 Регистрация в Mastodon → первый #introduction (ваше знакомство/самопрезентация) → мы дадим список из 10 подписок, с ними одиночество и фальшивые новости вам не грозят.
👍 Delta Chat/Jami без SIM и номеров мобильника → тестовое сообщение и вход в закрытый чат.
🙈 После короткого выступление наших инфобезников будет возможность пообщаться 1-на-1 или в мини-группу до 6 чел, а может и взять онлайн консультацию, чтобы в личке настроить все по шагам.
Важно: мы не обещаем, что приход лишён рисков. Несмотря на наши меры безопасности, прийти — это смелость. Мы встречаемся, чтобы усилить друг друга и получить инструменты, которые уменьшают уязвимость в сети с которыми каждый из нас уже сталкивается.
💌Для записи на мероприятие пиши на– @markgudman
#Introduction of some #scary movies-📽✨
▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.▾.
▾cannibal
▾chainsaw
▾heunt
▾hes out there
▾insidious
▾the nun
▾pet samatary
🤩@TowardDiscoveringEnglish🤩