Намери подобно съдържание

Изходен канал @clockstackwheels · Post #500 · 11.08

В ЛентеРу вышла статья о том, что ВК поставила рекорд по посещаемости и по просмотрам видеороликов. Давайте вместо разбора статьи я вам цитату из классики приведу. «Как будто в подтверждение его слов телекран у них над головами сыграл фанфару. Но на этот раз была не победа на фронте, а сообщение министерства изобилия. — Товарищи! — крикнул энергичный молодой голос. — Внимание, товарищи! Замечательные известия! Победа на производственном фронте. Итоговые сводки о производстве всех видов потребительских товаров показывают, что по сравнению с прошлым годом уровень жизни поднялся не менее чем на двадцать процентов. <...> Телекран все извергал сказочную статистику. По сравнению с прошлым годом стало больше еды, больше одежды, больше домов, больше мебели, больше кастрюль, больше топлива, больше кораблей, больше вертолетов, больше книг, больше новорожденных — всего больше, кроме болезней, преступлений и сумасшествия. С каждым годом, с каждой минутой все и вся стремительно поднималось к новым и новым высотам. <...> Завершив фанфарой сводку из министерства изобилия, телекран заиграл бравурную музыку. Парсонс от бомбардировки цифрами исполнился рассеянного энтузиазма и вынул изо рта трубку. — Да, хорошо потрудилось в нынешнем году министерство изобилия, — промолвил он и с видом знатока кивнул. — Кстати, Смит, у вас, случайно, не найдется свободного лезвия? — Ни одного, — ответил Уинстон. — Полтора месяца последним бреюсь.» Джордж Оруэлл, «1984» #web

Hashtags

#web

Резултати

Намерени 1 подобни публикации

Търсене: #sft

当前筛选 #sft清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #8851 · 24.10.2025 г., 22:00

Намери подобни Прегледай

🧠 Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, сравнив её «мозг» с мозгом пчелы. Он обучил модель считать, сколько раз буква r встречается в слове strawberry, и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи. Сначала генерируются диалоги: «Сколько букв r в слове strawberry?» и правильные ответы. После этого модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык. Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы. Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче понимает задачу. Nanochat решает задачу двумя способами: — логически, рассуждая пошагово; — через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата. Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные. 📘 Разбор: github.com/karpathy/nanochat/discussions/164 @ai_machinelearning_big_data #AI#Karpathy#Nanochat#LLM#SFT#RL#MachineLearning#OpenSource

Hashtags

#ai #karpathy #nanochat #llm #sft #rl #machinelearning #opensource