TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub 红队武器库🚨

TGINSIGHT SIMILAR POSTS

查找相似内容

Source channel @githubredteam · Post #83313 · 5月8日

🚨 GitHub 监控消息提醒 🚨发现关键词:#横向#移动 📦项目名称:aliyun-alb-pricing 👤项目作者:mjj913 🛠开发语言: None ⭐Star数量: 1 | 🍴Fork数量: 0 📅更新时间: 2026-05-08 05:55:53 📝项目描述: 阿里云ALB价格完整解析:实例费怎么算?LCU到底贵不贵?资源包值不值买?(附ALB/NLB/CLB三款横向对比) 🔗点击访问项目地址

Results

找到 1 条相似帖子

搜索 #sft

当前筛选 #sft清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8851 · 2025/10/24 22:00

🧠 Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, сравнив её «мозг» с мозгом пчелы. Он обучил модель считать, сколько раз буква r встречается в слове strawberry, и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи. Сначала генерируются диалоги: «Сколько букв r в слове strawberry?» и правильные ответы. После этого модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык. Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы. Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче понимает задачу. Nanochat решает задачу двумя способами: — логически, рассуждая пошагово; — через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата. Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные. 📘 Разбор: github.com/karpathy/nanochat/discussions/164 @ai_machinelearning_big_data #AI#Karpathy#Nanochat#LLM#SFT#RL#MachineLearning#OpenSource