TGTGInsightтелеграм анализLIVE / telegram public index
Съдържание на публикацията
Съдържание
Автономный агент для ресерча Идея простая: пусть агент планирует имплементацию, ищет ресурсы, дебажит имплементацию и затем учит / пишет код / делает эскпы. Клод код/ кодекс иногда любят откатывать версии моделей, недоделывать и просить помощи вида: " папа я покакал " * Это не некропост, оно обновляется. Этот скилл решает эту проблему: https://github.com/AlexWortega/claude-ml-intern-skill С его помощью я обучил deepseek4 style architecture на датасете tiny stories: https://huggingface.co/spaces/AlexWortega/ml-intern-v4-100m-tinystories-demo А еще перекатил себе flash attention для volta: https://github.com/AlexWortega/flash-attn-volta