TGTGInsighttelegram intelligenceLIVE / telegram public index
← Linuxgram 🐧

TGINSIGHT SIMILAR POSTS

Sib kontenut simili

Kanal tas-sors @linuxgram · Post #17821 · Fra 18

📰Linus T tells The Reg how Linux solo act became a global jam session Ts'o, Hohndel and the man himself spill beans on how checks in the mail and GPL made it all possible If you know anything about Linux's history, you'll remember it all started with Linus Torvalds posting to the Minix Usenet group on August 25, 1991, that he was working on "a (free) operating system (just a hobby, won't be big and professional like gnu) for 386(486) AT clones. 🔗 Source: https://go.theregister.com/feed/www.theregister.com/2026/02/18/linus_torvalds_and_friends/ #linux#gnu

Hashtags

Riżultati

1 post simili nstab

Tfittxija: #sft

当前筛选 #sft清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8851 · 24/10/2025 22:00

🧠 Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, сравнив её «мозг» с мозгом пчелы. Он обучил модель считать, сколько раз буква r встречается в слове strawberry, и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи. Сначала генерируются диалоги: «Сколько букв r в слове strawberry?» и правильные ответы. После этого модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык. Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы. Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче понимает задачу. Nanochat решает задачу двумя способами: — логически, рассуждая пошагово; — через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата. Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные. 📘 Разбор: github.com/karpathy/nanochat/discussions/164 @ai_machinelearning_big_data #AI#Karpathy#Nanochat#LLM#SFT#RL#MachineLearning#OpenSource