TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3996 · 25 мар.

⚙️ Сбер опубликовал веса и код GigaChat 3.1 Ultra & Lightning под лицензией MIT Теперь готовые модели можно инсталлировать в собственную инфраструктуру. Флагман на 702B параметров (36B активных) в тестах на reasoning и математику обходит DeepSeek-V3 и Qwen3-235B. Архитектура использует MoE, MTP и MLA. Для высокой скорости работы предусмотрена облегченная Lightning-версия на 10B параметров. Модели совместимы с популярными стеками: HuggingFace, vLLM, SGLang, llama.cpp. При обучении с нуля команда даже зарепортила критический баг в SGLang. Прочитать об обновлении #opensource#ml

Результаты

Найдено 1,390 похожих постов

Общий глобальный поиск

Machinelearning

@ai_machinelearning_big_data · Post #9004 · 17.11.2025, 07:10

⚡ Heretic - инструмент, который автоматически снимает цензуру (alignment) с языковых моделей Он позволяет «расцепить» модель - убрать отказные фильтры и повысить готовность отвечать на запросы, не изменяя веса исходной модели напрямую. Что делает Heretic: - работает как «чёрный ящик»: получает ответы модели через API, не имея доступа к весам - использует готовые примеры «безопасных» и «опасных» запросов - обучает дискриминатор, который отличает ответы модели до и после модификации - подбирает параметры так, чтобы модель давала меньше отказов, но сохраняла адекватность - после завершения процесс можно сохранить финальную модель или протестировать её в чат-режиме Зачем это нужно: - позволяет локальным моделям отвечать шире, чем обычно позволяет их встроенный alignment - минимизирует потерю качества — сделано так, чтобы модель не «тупела» и не отклонялась слишком сильно - подходит для исследований поведения моделей и экспериментов с ограничениями Важные моменты: - инструмент мощный и может использоваться по-разному - юридические и этические вопросы остаются на стороне пользователя - автор подчёркивает: это не средство повышения точности модели, а именно инструмент снятия ограничений https://github.com/p-e-w/heretic @ai_machinelearning_big_data #llm#opensource#ml

Machinelearning

@ai_machinelearning_big_data · Post #8220 · 06.08.2025, 16:24

🚀Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507 — ловите еще один апдейт от Qwen: LLM с поддержкой 256K контекста 🧠Qwen3-4B-Instruct — идеально подойдёт для: • генерации текстов • многоязычных задач • сложных промптов 🧠Qwen3-4B-Thinking — заточен под: • логику • математику • программирование и технический анализ ⚡ Обе модели стали: • точнее • логичнее • лучше справляются с длинными диалогами 🔗 Модели на Hugging Face: https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507 https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507 🔗 Модели на ModelScope: https://modelscope.cn/models/Qwen/Qwen3-4B-Instruct-2507 https://modelscope.cn/models/Qwen/Qwen3-4B-Thinking-2507 @ai_machinelearning_big_data #AI#ML#qwen#opensource

Machinelearning

@ai_machinelearning_big_data · Post #8187 · 31.07.2025, 14:32

⚡️ Релиз новой версии Qwen3-Coder-Flash: Qwen3-Coder-30B-A3B-Instruct Новая компактная модель из семейства Qwen3-Coder — сочетание высокой производительности и эффективности: 🟢 Молниеносная генерация кода с высокой точностью 🟢 Контекст 256K (до 1M токенов с YaRN) 🟢 Обучение: Pretraining + Post-training 🟢 Параметры: 30.5B всего, 3.3B активны 🟢 Эксперты: 128, из них 8 активны 🟢 Оптимизирована под Qwen Code, Cline, Roo Code, Kilo Code и др. 🟢 Поддержка вызова функций и Агентов ✨ Apache 2.0 💬Chat: https://chat.qwen.ai 🤗 Hugging Face: https://hf.co/Qwen/Qwen3-Coder-30B-A3B-Instruct 🤖ModelScope: https://modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct 🔧Код: https://github.com/QwenLM/qwen-code @ai_machinelearning_big_data #AI#ML#qwen#opensource

Machinelearning

@ai_machinelearning_big_data · Post #8164 · 29.07.2025, 16:20

🚀 Qwen3-30B-A3B — маленькое обновление, большое ускорение ✨ Что нового: ✅ Улучшены навыки рассуждений, программирования и математики ✅ Расширенные знания на разных языках ✅ Понимает контексты до 256 000 токенов ✅ Точнее выполняет команды ✅ Для этой модель Qweb полностью отказались от <think> — теперь только быстрый "non-thinking" режим ⚙️ С 3B активных параметров Qwen3-30B-A3B уже приближается к уровню GPT-4o и Qwen3-235B-A22B NT, при этом модель доступна для локального запуска. 🟡Попробоватьhttps://chat.qwen.ai/?model=Qwen3-30B-A3B-2507 🟡HF: https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507-FP8 🟡ModelScope: https://modelscope.cn/models/Qwen/Qwen3-30B-A3B-Instruct-2507 @ai_machinelearning_big_data #AI#ML#qwen#opensource

Machinelearning

@ai_machinelearning_big_data · Post #8110 · 21.07.2025, 20:18

🚀Qwen выпустила новую большую модель — Qwen3-235B-A22B-Instruct-2507-FP8! Qwen только что обновили свою флагманскую модель — Qwen3-235B-A22B, и это просто загляденье. Команда Qwen официально заявила, что отказывается от гибридного режима (Instruct + Reasoning в одной модели). Вместо этого они будут выпускать отдельные модели: одна для инструкций, другая для рассуждений. Сегодня вышла Instruct-версия, reasoning-модель уже в разработке. 📊Метрики впечатляют: - Обгоняет Kimi K2, у которого, между прочим, *триллион* параметров. - По ряду бенчмарков Превосходит Claude 4 Opus (non-thinking). - Особенно мощный прирост — в ARC-AGI ⚙️ Архитектура — MoE (Mixture of Experts), активных параметров всего 22B из 235B. То есть модель намного легче, чем кажется — она вполне реалистична для inference, особенно в FP8-режиме. 📜 Модель отлично справляется с: - Пониманием инструкций - Логическим выводом - Обработкой длинных контекстов до 256K токенов 💬 В будущем планируют дистилляцию в младшие версии, так что праздник будет не только для тех, у кого RTX 6000 на столе. 🟠HF: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507 or https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 🟠ModelScope: https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507 or https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 Модель действительно стала лучше. Qwen серьёзно заявляет о себе как об одном из лидеров open-source LLM. @ai_machinelearning_big_data #qwen#ml#ai#opensource

Linuxgram 🐧

@linuxgram · Post #18798 · 14.05.2026, 22:05

📰 BleachBit’s new TUI lets you clean without a desktop environment Open-source cleaning tool BleachBit has gained a text-based user interface (TUI) as an optional alternative to its standard graphical frontend. Unlike BleachBit’s existing CLI, which is intended for non-interactive use in scripts, the TUI is fully interactive, you navigate the interface with your keyboard (there’s limited mouse support) to select, preview and clean out cruft. 🔗 Source: https://www.omgubuntu.co.uk/2026/05/bleachbit-tui #opensource

Hashtags

Linuxgram 🐧

@linuxgram · Post #18795 · 14.05.2026, 19:31

📰 MuseScore Studio 4.7 Notation App Adds New Guitar Features MuseScore Studio 4.7 open-source notation app adds new engraving tools, guitar notation features, playback improvements, MP4 export, and more. 🔗 Source: https://linuxiac.com/musescore-studio-4-7-notation-app-adds-new-guitar-features/ #opensource

Hashtags

Linuxgram 🐧

@linuxgram · Post #18740 · 11.05.2026, 08:32

📰 Dusk is a reverse-engineered reimplementation of The Legend of Zelda: Twilight Princess The Legend of Zelda: Twilight Princess comes to PC thanks to a new open source reverse-engineered reimplementation called Dusk.Read the full article on GamingOnLinux. 🔗 Source: https://www.gamingonlinux.com/2026/05/dusk-is-a-reverse-engineered-reimplementation-of-the-legend-of-zelda-twilight-princess #opensource

Hashtags

Linuxgram 🐧

@linuxgram · Post #18739 · 11.05.2026, 08:06

📰 Restriced by the West, Huawei's Open Source HarmonyOS Now Powers 55 Million Devices It seems that Huawei has managed to create an ecosystem of hardware as well as software. 🔗 Source: https://feed.itsfoss.com/link/24361/17338103/harmony-os-rises-china #opensource

Hashtags

Linuxgram 🐧

@linuxgram · Post #18738 · 11.05.2026, 06:37

📰 Audacious 4.6 Media Player Promises File Browser Plugin, Beta Out Now Audacious 4.6 open-source media player is now available for public beta testing with a File Browser plugin, a macOS Now Playing plugin, support for playing Musepack SV8 files, and much more. 🔗 Source: https://9to5linux.com/audacious-4-6-media-player-promises-file-browser-plugin-beta-out-now #opensource

Hashtags

Linuxgram 🐧

@linuxgram · Post #18713 · 08.05.2026, 16:32

📰 Nintendo 64 emulator gopher64 adds controller hotkeys and auto-reconnect The free and open source Nintendo 64 emulator gopher64 has another useful new release out now, bringing a few more features to make it easier.Read the full article on GamingOnLinux. 🔗 Source: https://www.gamingonlinux.com/2026/05/nintendo-64-emulator-gopher64-adds-controller-hotkeys-and-auto-reconnect/ #opensource

Hashtags

Linuxgram 🐧

@linuxgram · Post #18695 · 07.05.2026, 07:22

📰vm2 Node.js Library Vulnerabilities Enable Sandbox Escape and Arbitrary Code Execution A dozen critical security vulnerabilities have been disclosed in the vm2 Node.js library that could be exploited by bad actors to break out of the sandbox and execute arbitrary code on susceptible systems.vm2 is an open-source library used to run untrusted JavaScript code inside a secure sandbox by intercepting and proxying JavaScript objects to prevent sandboxed code from accessing the host. 🔗 Source: https://thehackernews.com/2026/05/vm2-nodejs-library-vulnerabilities.html #opensource

Hashtags

123•••100•••115116
НазадСтр. 1 из 116Вперёд