TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3996 · 25 мар.

⚙️ Сбер опубликовал веса и код GigaChat 3.1 Ultra & Lightning под лицензией MIT Теперь готовые модели можно инсталлировать в собственную инфраструктуру. Флагман на 702B параметров (36B активных) в тестах на reasoning и математику обходит DeepSeek-V3 и Qwen3-235B. Архитектура использует MoE, MTP и MLA. Для высокой скорости работы предусмотрена облегченная Lightning-версия на 10B параметров. Модели совместимы с популярными стеками: HuggingFace, vLLM, SGLang, llama.cpp. При обучении с нуля команда даже зарепортила критический баг в SGLang. Прочитать об обновлении #opensource#ml

Результаты

Найдено 1 похожих постов

Поиск: #dataenginering

当前筛选 #dataenginering清除筛选
Data Science Jobs

@datasciencejobs · Post #2420 · 12.11.2024, 16:01

#вакансия#edtech#nlp#llm#dataenginering Наша команда проектирует и реализует образовательные решения под заказ крупных компаний в сфере: ИИ, дата инжиниринга и разработки на Java, React. Сейчас находимся в поиске Преподавателя в команду курса по большим языковым моделям. Человека с опытом в NLP и LLM. Подробнее: Проведение занятий по выбранным темам. Занятия в формате вебинаров 2 раза в неделю по 2 часа. Студенты - уровня jun и jun+. Оплата – до 30 000 руб. за проведение 1 занятия, по итогу собеседования. Интересно, свяжитесь со мной, и все обсудим) t.me/KaterinkaGl или [email protected]