TGTGInsighttelegram intelligenceLIVE / telegram public index
← OnePlus Guide

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @OnePlusGuide · Post #2452 · 26 avr.

~ WEEKLY UPDATE 332 ~ #OP#WEEKLY Iniziamo con la nuova rubrica! Nella Community sta ritornando la pace, ma le novità non si fermano! • La guerra tra i tipi di fotocamera frontale continua. Il team OnePlus ha realizzato un articolo analizzando i pro e i contro di ogni sistema adottato. Lo trovate qui • Nuove raffles! Potete vincere una borraccia OnePlus o una t-shirt. Qui trovate più informazioni • Le recensioni del programma The Lab sono fantastiche, forse la migliore edizione di sempre. Si possono vedere tutte qui • Dal debutto del 5 marzo, il programma IDEAS ha ricevuto un sacco di idee per migliorare OxygenOS! Potete ancora inviare i vostri suggerimenti entro il 30 aprile qui! • Il programma Open Beta è terminato per OnePlus 6 e 6T. Per assicurare un supporto continuo, è consigliato tornare al ramo stabile. Più dettagli qui. Le Beta 12 per OnePlus 7 e 7 Pro sono state ritirate a causa di problemi. É in corso l'analisi dei problemi per riprendere il rollout al più presto • Novità per OnePlus 5 e 5T! Tra pochi giorni sarà svelato un regalo per chi ancora usa questi telefoni (e sappiamo tutti di cosa si tratta). Restate sintonizzati su OnePlus Guide! • Un utente della community sta facendo un contest per regalare il suo "dbrand grip case con la black dragon skin" per OnePlus 7 Pro! Se vi interessa, date un'occhiata qui • Per i gamers, Fortinte è finalmente arrivato sul Play Store. Al riguardo è stata aperta una discussione ufficiale qui Pierre

Hashtags

Résultats

1 post similaire trouvé

Recherche : #sft

当前筛选 #sft清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8851 · 24/10/2025 22:00

🧠 Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, сравнив её «мозг» с мозгом пчелы. Он обучил модель считать, сколько раз буква r встречается в слове strawberry, и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи. Сначала генерируются диалоги: «Сколько букв r в слове strawberry?» и правильные ответы. После этого модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык. Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы. Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче понимает задачу. Nanochat решает задачу двумя способами: — логически, рассуждая пошагово; — через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата. Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные. 📘 Разбор: github.com/karpathy/nanochat/discussions/164 @ai_machinelearning_big_data #AI#Karpathy#Nanochat#LLM#SFT#RL#MachineLearning#OpenSource