TGTGInsighttelegram intelligenceLIVE / telegram public index
← GZ学习频道

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @olddriverGDstudy · Post #98 · Sep 12

#舔逼三步 第一步(初舔B) 亲阴唇时要把女性的明唇尽量吸吮到嘴里,用舌头轻扫轻舔,女性会觉得阴唇部位特别有点痒,她很想你亲更多位置,亲得更广些,别理她们,你亲你的就行了,你可以趁着她们正享受着的时候,轻轻的咬一下她的阴唇她肯定会“啊”的一下惊叫,身子抽动一下,在她还没来得及说话时,你快速把嘴唇整个贴在她的阴道口,这种做法可以让女性一下子感觉到整个阴部很温暖很舒服, 刚才的那声“啊”还没叫完就变成“噢”的一轻呼了。这时开始应该动手了,你应该用大拇指轻轻的将她的阴唇向两边分开蛋出女性的阴道口,用舌头在阴道口周围打转绕圈,时轻时重,时而整个嘴唇贴上。 这时候你可以稍为停下不亲阴道口,而是用湿润的舌尖轻轻撩几下她的阴蒂,把她的感觉从明蒂里撩拨起来,女性会轻叫几下,然后你再回去亲她的明道口和阴唇。 第二步(挑逗期) 不要在这时候再亲她的阴蒂,要让女性半吊在那种感觉里,而且男性要开始从女性的会阴处向阴蒂方向往上轻舔,慢点,舌头到达阴道口时左右拨动,把阴唇一边拨开一边向上继续舔,一点点向阴蒂部位接近。就是偏不要亲到阴蒂那,差不多到的时候你用舌尖轻轻的,越轻越好,只是在她的阴蒂上轻扫轻点一下(舌头要含点口水) ,随即反方向按上述亲法朝阴道口部位舔去。这样会把女性给急死的,她一急,自然就兴奋了。亲阴道口时,舌头长的男性可以尝试把舌头插入女性的明道内搅动。舌头宽厚的男性可以把舌头由阴道口自下往上扫动。 第三步(猛攻) 现在开始可以集中精力夺取“珍珠”了,清把舌头上移至女性的阴蒂处集中精力。女性的阴蒂是非常敏感的,如果你太大力舔动,她的痛感多过快感,就没意思了。亲吻阴蒂要注意几点,舌头一定要湿、轻、尖,一定要保持舌头湿润,亲舔阴蒂时一定要轻,要用舌尖来舔。进攻明蒂要用“点、挑、拨、压、搅”五字诀。点,是指用舌尖轻点轻触女性的阴蒂顶端;挑,是指舌头从阴蒂下面向上挑动;拔,是用舌头左右拨动女性的阴蒂;压,是时不时用舌头压女性的阴蒂,把它稍为压下即可;搅,是当你含住女性的阴蒂时用舌头在明蒂四周搅动。进攻明蒂要用“点、挑、拨、压、视员五字决,点,是指用舌尖轻点控用女性的阴蒂顶端;挑,是指舌头从阴蒂下面向上挑动; 拔,是用舌头左右拨动女性的阴蒂;压,是时不时用活头压女性的阴蒂,把它稍为压下即可, 搅,是当你含住女性的阴蒂时用舌头在阴蒂四周搅动。你可以感觉到她们的阴蒂下似乎有点筋会在跳动,这在你含着女性的阴蒂时感觉非常明显。不要随便中断女性的感觉,动作要平均,因为你突然而快节奏的动作很容易让女性到达高潮。觉得可以给对方高潮时,应该用整个嘴唇含住女性的阴蒂部位, 上嘴唇压在阴蒂上方的阴毛根部,下嘴唇左石分开女性的阴唇,尽量贴近阴道口,用口含住女性的阴蒂(留点空间),让女性觉得她的阴蒂是飘浮在你的嘴里的,用五字决发动进攻。让对方猛的一阵抽搐,看着她快到时,轻轻一放,然后马上又含上去。 (评论区附图解) 标签:#知识,#技巧

Results

19 similar posts found

Search: #rl

当前筛选 #rl清除筛选
Am Neumarkt 😱

@amneumarkt · Post #302 · 12/11/2021, 10:19 AM

#ml#rl How to Train your Decision-Making AIs https://thegradient.pub/how-to-train-your-decision-making-ais/ The author reviewed "five types of human guidance to train AIs: evaluation, preference, goals, attention, and demonstrations without action labels". The last one reminds me of the movie Finch. In the movie, Finch was teaching the robot to walk by demonstrating walking but without "labels".

Hashtags

Machinelearning

@ai_machinelearning_big_data · Post #8473 · 09/08/2025, 03:28 PM

🦾 Google DeepMind показала, как роботы учатся работать вместе с помощью обучения с подкреплением. Учёные из UCL, Google DeepMind и Intrinsic представили новый AI-алгоритм RoboBallet — систему, которая позволяет нескольким роботизированным манипуляторам работать синхронно и без столкновений в сложной производственной среде,. 🔹 В эксперименте участвовали 8 роботов, каждый из которых мог выполнять 40 разных задач в одном общем пространстве. 🔹 Роботы могли брать любую задачу в любом порядке — система сама решала, кому что поручить и как построить безопасные траектории. 🔹 Алгоритм обучался в симуляции, а затем сразу работал в новых условиях без дообучения (*zero-shot*). Пока решение работает только для задач перемещения (reaching), без учёта порядка выполнения или разных типов роботов. Однако архитектура гибкая — в будущем возможно добавление сложных задач, зависимостей и разнообразных роботов. Один алгоритм смог координировать целую команду, делая роботов гибкими и слаженными даже там, где они раньше не работали. 🟢 Подробнее: https://www.science.org/doi/10.1126/scirobotics.ads1204 @ai_machinelearning_big_data #google#robots#ai#rl

Am Neumarkt 😱

@amneumarkt · Post #320 · 02/17/2022, 09:32 AM

#ML#RL#DeepMind Magnetic control of tokamak plasmas through deep reinforcement learning | Nature https://www.nature.com/articles/s41586-021-04301-9

Агенты ИИ | AGI_and_RL

@agi_and_rl · Post #765 · 04/25/2024, 02:05 PM

🎓 — Семинар 29. Curriculum Learning: выбор последовательности задач для обучения с подкреплением | Мария Нестерова Завтра на семинаре выступит выпускница нашей магистерской программы МТИИ и ныне аспирантка нашего Центра, у которой уже 2 статьи на А*! Если перед агентом стоит сложная задача, то для её освоения с нуля может потребоваться много времени. Один из способов решить эту проблему — рассмотреть сначала более простые задачи. Расписание обучения (Curriculum) позволяет автоматически выбрать задачи и определить порядок их изучения, что ускоряет процесс освоения сложных задач. В первой части доклада будут рассмотрены существующие подходы к составлению расписания обучения. В рамках нашего исследования расписание обучения представлено в виде мета-агента, который выбирает задачи на основе анализа способностей обучающегося агента. Вторая часть доклада будет посвящена нашему методу и текущим результатам 📹 Трансляция Youtube Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех! #семинары#RL

Агенты ИИ | AGI_and_RL

@agi_and_rl · Post #692 · 02/07/2024, 03:15 PM

🎓— Семинар 18. Mastering Memory Tasks with World Models | Артём Жолус Завтра на семинаре выступит выпускник нашей магистерской программы МТИИ, ныне аспирант университета Монреаля и научный сотрудник лаборатория MILA (основанной Йошуа Бенджио) Артём Жолус "В этом докладе я представлю Recall2Imagine (R2I), новую модель мира, которая может справиться с любой RL-задачей, требующей большого объема памяти агента (memory-intensive RL task). Эта модель построена на основе комбинации State-Space Models (SSMs), нового типа foundation model, и модели мира DreamerV3. Я покажу, как новая модель может освоить 30+ memory RL сред , включая MemoryMaze - среду, вдохновленную нейронаукой, в которой R2I является первым RL алгоритмом, достигшим сверхчеловеческой награды. Кроме того, я покажу, как память R2I остается устойчивой к различным типам контроля" — Tomorrow, a graduate of our master's program, now a graduate student at the University of Montreal and a researcher at the MILA laboratory (founded by Yoshua Bengio) Artem Zholus will speak at the seminar. "In this talk, I will present Recall2Imagine (R2I), a new world model that can master any memory-intensive RL task out of the box. This model is built upon a combination of State-Space Models (SSMs), a new type of foundation model, and DreamerV3. I will show how a new model can master 30+ memory-intensive environments, including MemoryMaze, which is a neuroscience-inspired environment where R2I is the first algorithm that achieves superhuman performance. In addition, I'll show how R2I's memory remains robust to different types of control and observations in 50+ standard RL environments. The talk covers our paper accepted at ICLR 2024 with oral talk (top-1.2% of accepted papers)." 📹Youtube Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех! — Join the live discussion and ask questions live! Waiting for everyone! #семинары#RL

Data Science Jobs

@datasciencejobs · Post #2700 · 04/28/2025, 01:00 PM

#job#middle#senior#RL#ML Вакансия: Data Scientist с опытом RL Формат работы: гибрид, офис в Москве Вилка: от 5000$ до 6000$ Компания: я являюсь рекрутером компании Task Agency Что предлагаем: •Удобный офис в Москве; •Поощрения по результатам работы, привязанные к успеху торговой стратегии; •Гибкая гибридная модель работы, адаптированная к индивидуальным и командным потребностям; •Заработная плата в криптовалюте и тд Что мы ожидаем: •Высшее образование в области количественных финансов, компьютерных наук, математики или статистики. •Опыт в области количественных исследований и применения методов обучения с подкреплением (RL). •Глубокое понимание математического моделирования, статистического анализа и методов оптимизации. •Отличные навыки программирования на Python, а также опыт работы с фреймворками глубокого обучения, такими как TensorFlow, PyTorch, JAX. •Приветствуется опыт работы в трейдинге, маркет-мейкинге или высокочастотной торговле (HFT). •Опыт разработки инструментов для бэктестинга и моделирования будет большим преимуществом. Будет плюсом: •Знание методов оптимизации алгоритмов, таких как эволюционные алгоритмы и байесовские подходы. •Опыт работы с блокчейн-технологиями, смарт-контрактами и торговыми средами DeFi. •Навыки работы в высокопроизводительных вычислительных средах (HPC). Основные задачи: •Разработка торговых моделей для пар ETH/USD+ и cbBTC/USD+ для рынков DeFi. •Внедрение моделей на основе обучения с подкреплением (RL), таких как DQN и AS для маркет-мейкинга. •Проведение бэктестинга и моделирования для оценки стратегий и тд. По всем вопросам @ValeriyaStynke

Data Science Jobs

@datasciencejobs · Post #3051 · 11/27/2025, 10:00 AM

#ML#NLP#LLM#RL#remote#huggingface Компания: High Sky; Позиция: Senior LLM-Engineer для решения задачи SWE Вилка: от 8000$ до 15000$; Формат: удаленная работа; Занятость: full-time; Опыт: от 6 лет. Мы - динамично развивающийся стартап, решающий различные задачи AI в соревновательном формате: генерация текста, аудио и видео, обогащение данных, предиктивная аналитика. Мы осуществляем полный цикл работы над продуктом: от анализа бизнес-задачи до вывода в продакшен полноценного решения Находимся в поиске Senior LLM-Engineer для решения задачи SWE Чем предстоит заниматься: - Главная задача - разработать агента для решения SWE задач - обучение LLM - написание кода агента, запускаемого в sandbox - fine-tuning LLM - Построение пайплайнов валидации и оценки моделей и агентов - Сбор, очищение данных - Выбор архитектур и pre-trained моделей - Объединение моделей и адаптеров Требования к кандидату: - Опыт обучения LLM (fine-tuning / pre-training) от 2 лет - Опыт применения различных методов обучения LLM - Опыт с различными pre-trained моделями - Опыт работы с экосистемой huggingface: transformers, datasets, peft, trl - Хорошее понимание теоретической базы NLP, transformers, LLM. Понимание всех циклов предобучения и файнтюнинга, RL, classic ML - Опыт коммерческой разработки с нуля - Опыт работы от 6 лет - Высшее образование в области компьютерных технологий / прикладной математики и (или) прикладной информатики; Будет плюсом: - Опыт решения задачи SWE-bench - Научные исследования по Computer Science - Призовые места в соревнованиях (kaggle, boosters), опыт участия в хакатонах - ШАД / Школа 21 Что мы предлагаем: - Участие в разработке динамично развивающегося продукта, работающего на рынке в реальном времени; - Справедливую заработную плату по результатам собеседования и вашей квалификации; - Возможность прокачивать свою экспертизу за счет работы с топовыми коллегами и обучения в моменте; - Классный молодой коллектив профессионалов, заряженных на результат. Ценим порядочность, честность и открытость; - Горизонтальную структуру, отсутствие бюрократии и синдромов «больших начальников»; - Мы за результат, а не процесс. У всех наших сотрудников удобный график и полностью удаленная работа без привязке к стране. Для отклика пишите@perovvaa📩

Machinelearning

@ai_machinelearning_big_data · Post #9053 · 11/23/2025, 07:14 AM

🌟RL-фреймворк для обучения MoE-моделей от создателей Chatbot Arena. Miles - фреймворк для RL-обучения от команды LMSYS ORG, ориентированный на энтерпрайз-уровень. Если вы следите за опенсорс разработками, вы наверняка слышали о предшественнике этой системы, проекте slime. Это легкий инструмент, который используют во многих современных пайплайнов пост-трейна. На нем, кстати, запускали GLM-4.6. Slime доказал, что легковесный дизайн работает, и Miles делает следующий шаг - масштабное обучение архитектур MoE и поддержка тяжелых промышленных нагрузок. 🟡Технические детали. Miles предлагает то, что называют "True On-Policy". Раньше между тренировкой и инференсом часто возникало расхождение. Теперь же, благодаря инфраструктурному подходу, LMSYS добилась нулевой дивергенции. Это стало возможным благодаря использованию Flash Attention 3, библиотеки DeepGEMM и ядер от Thinking Machines Lab, работающих в связке с torch.compile. Вторая особенность - в использовании спекулятивного декодирования. Обычно в RL черновая модель замораживается, что мешает ей следовать политике целевой модели. LMSYS добавили онлайн-обучение черновой модели. Результаты на тестах положительные: ускорение генерации более чем на 25%, особенно на поздних стадиях обучения. 🟡Стабильность. Для энтерпрайза память - это деньги. В Miles включили механизмы, предотвращающие падение системы при некритичных ошибках OOM и исправили чрезмерное потребление памяти в FSDP. В дорожной карте проекта обещают поддержку мультимодального обучения, совместимость со SGLang v2 и расширенное спекулятивное декодирование. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RL#Miles#LMSYS

Machinelearning

@ai_machinelearning_big_data · Post #8194 · 08/02/2025, 01:04 PM

🌟X-Omni от Tencent: авторегрессионная text-to-image модель с RL. X-Omni - методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень. X-Omni построена на гибридной, но при этом унифицированной архитектуре. Схематично она выглядит так: Семантический токенизатор изображений SigLIP-VQ с фиксированным словарем на 16 384 токена кодирует картинку в дискретные токены. Эти визуальные токены вместе с текстовыми подаются в единую авторегрессионную модель на базе Qwen2.5-7B. Наконец, в финальном рендеринге используется диффузионный декодер на основе FLUX.1-dev. 🟡Уникальность метода - в смеси RL по GRPO и комплексной reward-системе. Вместо одного критерия, модель оценивается сразу по нескольким направлениям. За эстетику и соответствие предпочтениям человека отвечает HPSv2 и модель Unified Reward. За семантическую связь между промптом и изображением — VLM-модель Qwen2.5-VL-32B. А за самое сложное, отрисовку текста внутри картинки, отвечает отдельная награда на основе OCR-систем GOT-OCR2.0 и PaddleOCR. Тестовую модель X-Omni обучали на смеси из 200 млн. изображений, которые после токенизации превратились в 600 млрд мультимодальных токенов, а на этапе SFT использовал ещё 1.5 млрд. токенов. Для RL-фазы был отобран микс из 180 тыс. промптов, состоящий как из творческие запросы, так и задач на рендеринг текста. 🟡И это дало свои плоды, особенно в отрисовке текста, где авторегрессионные модели исторически пасовали. На бенче OneIG-Bench X-Omni показала результат 0.901 для английского языка, обойдя GPT-4o (0.857). А на собственном LongText-Bench, специально созданном для оценки рендеринга длинных надписей, модель буквально разгромила всех в китайском языке, набрав 0.814 балла против 0.619 у GPT-4o. В задачах общей генерации по тексту X-Omni также на высоте. На DPG-Bench модель достигла SOTA-результата 87.65, опередив GPT-4o (86.23) и Show-o2 (86.14). На GenEval результат составил 0.83, чуть-чуть не дотянув до модели Mogao (0.89). Даже в задачах на понимание изображений X-Omni показывает себя достойно: на OCRBench ее результат (704) превосходит другие унифицированные модели, например Emu3 (687). 🟡Интересные подробности. Во-первых, X-Omni не нуждается в CFG. В отличие от Emu3 или Janus-Pro, качество которых резко падает при отключении CFG, X-Omni работает стабильно. Во-вторых, что, пожалуй, самое важное, RL превосходит даже SFT с последующим сэмплингом best-of-N. Этот вывод идет вразрез с устоявшимся мнением в области языкового моделирования и доказывает, что для изображений холистическая оптимизация через RL дает существенный прирост качества. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Набор моделей 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#T2I#RL#XOmni#Tencent

Агенты ИИ | AGI_and_RL

@agi_and_rl · Post #550 · 05/13/2023, 04:02 PM

😊Одна из самых крутых библиотек для RL агентов - это библиотека ml-agents для Unity. Позволяет довольно быстро освоиться с применением RL в играх. На видео представлен уже предобученный агент из библиотеки, которого научили ходить и собирать зеленые кубики. По ссылочкам можно найти все необходимое, но главное - примеры. Среди этих примеров можно посмотреть как учили: машины парковаться, самолеты летать, агентов играть в футбол и много всего. Некоторые из них мы в будущем поразбираем. Имеем из плюсов: ➕ Разработчики уже знакомые с моделированием сред (а это один из ключевых компонентов обучения с подкреплением) могут быстро влиться в тему. ➕ Имеем все плюшки Unity, вроде кросплатформенности, кучи готовых решений, C#. Зрелость самой платформы и огромная аудитория. ➕ Много готовых сред и предобученных агентов. ➕ Есть Python API. ➕ На ютубе и в интернете уже довольно много разборов с описаниями как ее применять. Очень рекомендую эту библиотеку попробовать, если Unity Вам близок. Если в целом имеется опыт программирования и разработки, то разобраться очень легко... Думаю что далее я еще пройдусь по енвам в Unity и может мы поделаем кастомные окружения. И мы точно еще много будем говорить о визуальных библиотеках и как там RL применяют. #rl#unity#AGI_and_RL

Machinelearning

@ai_machinelearning_big_data · Post #8851 · 10/24/2025, 10:00 PM

🧠 Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, сравнив её «мозг» с мозгом пчелы. Он обучил модель считать, сколько раз буква r встречается в слове strawberry, и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи. Сначала генерируются диалоги: «Сколько букв r в слове strawberry?» и правильные ответы. После этого модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык. Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы. Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче понимает задачу. Nanochat решает задачу двумя способами: — логически, рассуждая пошагово; — через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата. Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные. 📘 Разбор: github.com/karpathy/nanochat/discussions/164 @ai_machinelearning_big_data #AI#Karpathy#Nanochat#LLM#SFT#RL#MachineLearning#OpenSource

12
PreviousPage 1 of 2Next