TGTGInsighttelegram intelligenceLIVE / telegram public index
← Attention Signs
Attention Signs avatar

TGINSIGHT POST

Post #112

@attnsigns

Attention Signs

Views87Post view count
PostedSep 209/02/2025, 09:31 AM
Post content

Post content

Важный апдейт! Я скоро буду мигрировать в другую компанию, даже не знаю, будет ли там время/возможность запускать обучение будущих моделей.. Но даже если такой возможности не предвидится - думаю, буду арендовать сервера с GPU. В связи с этим, сделал коммит с имплементацией Dynamic Finetuning (DFT), о котором писал выше, можно пробовать тренироваться таким методом) Так же, всё-таки решил залить экспериментальную модель Pharade, о которой тоже писал! Она была натренирована на специальных синтетических данных и способна генерировать гипотезы, прежде чем решать задачку. Это похоже на tree search, где модель может оставлять себе заметки, какие подходы проверить, а какие заранее тупиковые, что, в потенциале, может уменьшать бюджеты ризонинга. Не знаю, насколько оно работает на самом деле, но по крайней мере выглядит прикольно. Хотелось бы ещё дообучить всё это дело GRPO-like методами, чтобы посмотреть, что может получиться. Вот пример того, что генерируется в специальном блоке: [Goal: Найти основание b] → [H1: Использовать формулу площади S=b*h?] ↓ [H1.1: Подставить известные значения] → | [H1.1.1: 420 = b * 35!] # Недостаточно данных | [H1.1.2: Переписать уравнение] → [H1.1.2.1: b = 420 / 35!] [H1.1.2.2: Вычислить результат] ! [H2: Связать стороны через периметр?] | [H2.1: Периметр P = 2(a + b)!] → [H2.1.1: Нужно второе уравнение?] *X | [H2.2: Дополнительные условия? ] ? [H3: Проверить альтернативные подходы] ? ↓ | [H3.1: Геометрическая интерпретация] → [H3.1.1: Площадь как проекция] → | [H3.1.1.1: Если угол между основанием и высотой α, то S=b*h_перпендикулярна] *X | [H3.1.1.2: Альтернатива: использовать векторы] *V | [H3.2: Координатный метод] → [H3.2.1: Поставить систему координат] → | [H3.2.1.1: Вершины A(x₁,y₁), B(x₂,y₂)] | [H3.2.1.2: Векторное произведение AB × AD = BC × CD] *X [H4: Сравнить методы] ↑ [H4.1: Результаты H1.1.2.2 совпадают?] → | [H4.1.1: Да → Ответ 12] | [H4.1.2: Нет → Противоречие/недостаток данных] *X [H5: Проверка вычислений] $ → | [H5.1: Повторить деление 420/35!] | [H5.2: Убедиться в корректности формулы площади] В общем, надеюсь, пока я ещё тут и у меня есть доступ к GPU, хоть что-то успею дообучить!