TGTGInsighttelegram intelligenceLIVE / telegram public index
← GZ学习频道

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @olddriverGDstudy · Post #40 · Mar 17

秀哥语录: 开水烫鸡把,锻炼起来 123的兄弟,我给你们说个方法 蛮有效的,就是开水烫几把 你每天洗澡的时候,水温稍微调高一点点 比如平时40度,你就45 用淋浴头冲,冲龟头,每天冲个五分钟 正经点,靠,虽然开水烫几把名字不正经 但是真的有用 你快,是因为敏感,每天冲,可以降低敏感度 一边冲,一边两个指头按压捏,每天五分钟 养成习惯,慢慢就好了 到后期,你可以用毛巾,湿水 然后慢慢尝试那毛巾擦龟头,上下撸 什么时候毛巾擦龟头,你不抖了,就好了 慢慢来啊,过犹不及,慢慢锻炼,降低龟头敏感度 可以尝试下,多少有点用 另外就是心里调节了 不要老是想,不要在意长短 学会去享受,要自信,自我暗示,我是来爽的,不是来比赛的 心里 生理 双管齐下,从此告别123 #秀哥语录#语录

Results

1 similar post found

Search: #sft

当前筛选 #sft清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8851 · 10/24/2025, 10:00 PM

🧠 Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, сравнив её «мозг» с мозгом пчелы. Он обучил модель считать, сколько раз буква r встречается в слове strawberry, и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи. Сначала генерируются диалоги: «Сколько букв r в слове strawberry?» и правильные ответы. После этого модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык. Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы. Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче понимает задачу. Nanochat решает задачу двумя способами: — логически, рассуждая пошагово; — через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата. Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные. 📘 Разбор: github.com/karpathy/nanochat/discussions/164 @ai_machinelearning_big_data #AI#Karpathy#Nanochat#LLM#SFT#RL#MachineLearning#OpenSource