TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3621 · 22 июн.

​👼Чем занимается HR в компании? — [1:04:17] И нет, это не тот, кто в случайном порядке выбирает, брать ли сотрудника на работу. Многие программисты вообще не понимают, зачем нужен HR в компаниях, но, как ни крути, именно он решает, как сложится ваша карьера. Поэтому, в этом видео Алина, HR-менеджер с трёхлетнем опытом, подробно рассказывает про особенности проведения собеседований. Посмотрев его, вы научитесь отвечать на каверзные вопросы HR-менеджера и в общих чертах поймёте, по каким качествам отбирают сотрудников в IT-компанию. Перейти к просмотру #видео#профессия

Результаты

Найдено 3 похожих постов

Поиск: #gptoss

当前筛选 #gptoss清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8413 · 29.08.2025, 18:01

🚀 OpenAI **gpt-oss** с ультрадлинным контекстом! Unsloth выпустили Flex Attention, который даёт до 61K контекста для gpt-oss bf16 при обучении на GPU с 80GB. 📊 Что это значит: - 8× больше контекста - потребляет на 50% меньше VRAM - 1.5× быстрее по сравнению с альтернативами (включая FA3) Для BF16 LoRA теперь можно тренировать с ~60K контекстом на одной H100 80GB. 🔗 Подробнее: https://docs.unsloth.ai/basics/long-context-gpt-oss-training @ai_machinelearning_big_data #Unsloth#OpenAI#gptoss#chatgpt

Machinelearning

@ai_machinelearning_big_data · Post #8238 · 08.08.2025, 11:34

⚡️GGUF-версии GPT-OSS от Unsloth. Unsloth конвертировали обе GPT-OSS (20B и 120B) и исправили ошибки, чтобы повысить качество инференса. 🟡Оптимальный сетап: 🟢20B работает со скоростью более 10 токенов/с при полной точности на 14 ГБ оперативной памяти. 🟢120B с полной точностью будет давать >40 токенов/с на примерно 64 ГБ ОЗУ. Минимальных требований для запуска моделей нет, запуститься можно даже если у вас всего 6 ГБ и только CPU, но инференс будет медленнее. GPU не требуется , особенно для модели 20B, но его наличие значительно увеличивает скорость вывода (~80 токенов/с). С чем-то вроде H100 можно получить пропускную способность 140 токенов/с, и это значительно быстрее, чем у OpenAI в ChatGPT. Модели можно запустить через llama.cpp, LM Studio или Open WebUI. Если модель 120B слишком медленная, попробуйте версию 20B - она очень быстрая и работает не хуже o3-mini. Помимо моделей формата GGUF c полной точностью, Unsloth сделали версии с 4-bit и 16-bit точностью. 4-бинтый квант, кстати, можно файнтюнить на 24 ГБ VRAM. 📌 Подробная пошаговая инструкция по локальному запуску и файнтюну - в документации Unsloth. 🟡Набор моделей 🟡Документация @ai_machinelearning_big_data #AI#ML#GPTOSS#GGUF#Unsloth

Machinelearning

@ai_machinelearning_big_data · Post #8215 · 06.08.2025, 10:09

🖥gpt-oss работает на специальном формате промптов — Harmony, и без него модель просто не будет выдавать корректные ответы. Зачем нужен Harmony? Этот формат нужен для: — 🧠 генерации chain of thought рассуждений — 🔧 корректного вызова функций и использования инструментов — 📦 вывода в разные каналы: обычный ответ, reasoning, tool call — 🗂️ поддержки tool namespaces и иерархических инструкций 💡 Harmony имитирует OpenAI Responses API, так что если вы с ним работали — будет легко освоиться. 👉 Если вы используете gpt-oss через HuggingFace, Ollama или vLLM, волноваться не нужно. Но если строите свой пайплайн — обязательно изучитегайд по Harmony. Без него модель просто не будет работать как надо. pip install openai-harmony # or if you are using uv uv pip install openai-harmony @ai_machinelearning_big_data #gptOSS#Harmony#OpenAI#LLM#PromptEngineering