❗️ВАЖНО❗️
🎾Обратная связь по четвертой неделе интенсива
Оставить отзыв на занятия прошлой недели 12 и 15 сентября можно по ссылке: https://forms.gle/HCXZb1B8q77FoGDy8
🎾Обновления в домашних заданиях
В домашней работе №3:
– исправили ответы на вопросы №2 и №7
– добавили дополнительные 2 попытки, чтобы вы могли снова выполнить откорректированный тест (итого 5 разрешенных попыток)
– продлили дедлайн до 24 сентября 23:59 (мск)
В домашней работе №4:
– поправили прием ответа на вопрос №12 (ранее у некоторых студентов возникали трудности)
– добавили дополнительные 2 попытки, чтобы вы могли снова выполнить откорректированный тест (итого 5 разрешенных попыток)
– дедлайн остается тем же: 30 сентября 23:59 (мск)
🎾 У меня возникают разные вопросы по задачам — к кому обратиться?
К хелперам в Discord-комьюнити: мы раздали роль helpers тем, кто готов помогать начинающим с нуля. Хелперы отображаются красным цветом.
Создали 10 мини-групп с 2-3 хелперами в каждой.
В ближайшее время начнем распределять по мини-группам студентов, которые оставили реакции под постом о наборе в мини-группы начинающих.
Этот пост находится в последнем закрепленном сообщении на канале #python-и-математика: реакции все еще можно оставить, если вы хотите в мини-группу.
Хорошей недели!
Команда Mathshub
🚀 OpenAI **gpt-oss** с ультрадлинным контекстом!
Unsloth выпустили Flex Attention, который даёт до 61K контекста для gpt-oss bf16 при обучении на GPU с 80GB.
📊 Что это значит:
- 8× больше контекста
- потребляет на 50% меньше VRAM
- 1.5× быстрее по сравнению с альтернативами (включая FA3)
Для BF16 LoRA теперь можно тренировать с ~60K контекстом на одной H100 80GB.
🔗 Подробнее: https://docs.unsloth.ai/basics/long-context-gpt-oss-training
@ai_machinelearning_big_data
#Unsloth#OpenAI#gptoss#chatgpt
⚡️GGUF-версии GPT-OSS от Unsloth.
Unsloth конвертировали обе GPT-OSS (20B и 120B) и исправили ошибки, чтобы повысить качество инференса.
🟡Оптимальный сетап:
🟢20B работает со скоростью более 10 токенов/с при полной точности на 14 ГБ оперативной памяти.
🟢120B с полной точностью будет давать >40 токенов/с на примерно 64 ГБ ОЗУ.
Минимальных требований для запуска моделей нет, запуститься можно даже если у вас всего 6 ГБ и только CPU, но инференс будет медленнее.
GPU не требуется , особенно для модели 20B, но его наличие значительно увеличивает скорость вывода (~80 токенов/с). С чем-то вроде H100 можно получить пропускную способность 140 токенов/с, и это значительно быстрее, чем у OpenAI в ChatGPT.
Модели можно запустить через llama.cpp, LM Studio или Open WebUI. Если модель 120B слишком медленная, попробуйте версию 20B - она очень быстрая и работает не хуже o3-mini.
Помимо моделей формата GGUF c полной точностью, Unsloth сделали версии с 4-bit и 16-bit точностью. 4-бинтый квант, кстати, можно файнтюнить на 24 ГБ VRAM.
📌 Подробная пошаговая инструкция по локальному запуску и файнтюну - в документации Unsloth.
🟡Набор моделей
🟡Документация
@ai_machinelearning_big_data
#AI#ML#GPTOSS#GGUF#Unsloth
📌Тренируем FunctionGemma самостоятельно.
LM Studio в коллаборации с Unsloth опубликовали подробный туториал по файнтюнингу недавно выпущенной Google модели FunctionGemma.
FunctionGemma - уменьшенная версия Gemma (всего 270Ь параметров) для агентских сценариев и работы в качестве бэкенда приложений, которую можно запускать практически на любом устройстве.
Гайд состоит из подробного описания всего процесса от обучения модели вызову инструментов до преобразования в GGUF-формат и последующего запуска его в LM Studio
Туториал подойдет для локального трейна (Unsloth работает на NVIDIA, AMD и Intel), но есть и готовый Collab Notebook для тренировки в облаке.
⚠️ FunctionGemma не предназначена для использования в качестве прямой диалоговой модели.
@ai_machinelearning_big_data
#AI#ML#LLM#Tutorial#Unsloth#LMStudio