TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3250 · 26 сент.

​🤖Делаем нейросеть с нуля — [17:16] Как бы вас не запугивали, нейросети писать не сложно и можно сделать это даже в 90 строк кода. Достаточно просто хорошо разбираться в математике. Автор рассказывает про принципы работы нейронных сетей и создаёт проекты на их основе. Например, определение числа на основе пикселей. Перейти к просмотру #видео#ai

Результаты

Найдено 1 похожих постов

Поиск: #sparseattention

当前筛选 #sparseattention清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8641 · 29.09.2025, 10:22

🚀 DeepSeek-V3.2-Exp - вышла новая экспериментальная версия ⚡ Главное: - Основана на V3.1-Terminus - Новый механизм Sparse Attention (DSA) → быстрее и дешевле работа с длинными контекстами - Качество почти без потерь, производительность как у V3.1 - API подешевел более чем на 50% 📊 V3.1 пока ещё будет доступна до 15 октября 2025. 💰 Цены: - Input (cache hit): $0.07 → $0.028 (−60%) - Input (cache miss): $0.56 → $0.28 (−50%) - Output: $1.68 → $0.42 (−75%) 🔗 Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp) 🔗 Tech Report:https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf) 🔗Github: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf @ai_machinelearning_big_data #DeepSeek#AI#V32#SparseAttention#LLM