TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #968 · 28.03

Стругацкие, «Волны гасят ветер». Книга оформлена в виде как бы отчётов о расследовании, хотя и здесь авторы дали себе вольность и с самого начала обосновали, почему эти отчёты составлены художественным языком. Вообще, мне очень нравится идея прогрессорства. «Прогрессор» — это представитель высокоразвитой цивилизации, который тайно и, хм, насильственно влияет на ход истории более примитивной цивилизации, чтобы направить её на истинный путь. Тайно — чтобы не шокировать неокрепшие умы «неандертальцев». Насильственно — потому что примитивная цивилизация не осознаёт своего счастья и сопротивляется добру. Эта идея мне нравится своей реалистичностью. Если мы посмотрим какой-нибудь «Стартрек», то там много пафоса о том, что, дескать, люди будущего ни в коем случае не должны вмешиваться в недоразвитые устои условных средневековых обществ с других планет. Вокруг этой идеи сосредоточено очень много драмы: бабуины захватили в плен твоего коллегу-звездолётчика, и ты вроде бы можешь их всех раскидать с помощью бластера, но не должен этого делать, и вот какое сложное решение, как же быть... Выглядит, как наигранная беззубость и малодушие, прикрытые идеалистическим гуманизмом (который не работает). Всем понятно, что в реальности от бабуинов не осталось бы мокрого места по праву сильного, а может и другим бабуинам тоже досталось бы в качестве урока. Так что у Стругацких даже очень просветлённые и живущие в коммунистическом раю представители человечества с лёгкостью используют свои технологии, чтобы перекраивать и навязывать. Но когда что-то подобное вроде бы начинают делать уже с самими Землянами, поднимается паника (среди тех, кому об этом известно). Там даже есть такие рассуждения: боимся не того, что ещё более сильная цивилизация причинит нам зло, а того, что она причинит нам добро так, как сама это понимает. Концовка, конечно, переворачивает всё с ног на голову, и я бы сказал, что фантазия авторов в этом месте пошла слишком уж далеко. Ну, а к чувству незавершённости после каждого романа Стругацких я уже потихоньку привык. В целом интересно и как часть трилогии, и даже как вполне самостоятельное произведение, хотя с миром всё равно полезно быть знакомому, чтобы лучше понимать происходящее. #fiction

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #step3

当前筛选 #step3清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9447 · 29.01.2026 г., 16:04

🌟Step3-VL-10B: VLM от stepfun.ai. Пока индустрия одержима гигантоманией и соревнуется, у кого больше параметров, Stepfun решили пойти против течения. Встречайте, Step3-VL-10B - компактная VL-модель, которая по заявлениям разработчиков не просто конкурирует, а буквально уделывает модели в 10–20 раз тяжелее, включая таких титанов, как Gemini 2.5 Pro и GLM-4.6V. Звучит как маркетинговый хайп, но под капотом есть интересные инженерные решения, хоть и с хитринкой. 🟡Архитектура Конструкция из кастомного визуального PE-lang энкодера на 1.8B параметров и Qwen3-8B (что уже половина успеха, учитывая мощь Qwen) в качестве декодера. В отличие от многих, кто замораживает визуальную часть, Stepfun разморозили все и тренировали модель в один прогон на 1,2 трлн. токенов. Это позволило визуальной и языковой частям модели не просто сосуществовать, а реально срастись и притереться друг к другу. После этого модель прогнали через адский RL-цикл (RLVR+RLHF) на 1400+ итераций, чтобы модель научилась жестко ризонить. 🟡Тесты В бенчмарках цифры действительно страшные (в хорошем смысле) для такого размера: 🟢MMMU: 78.11 (SeRe) / 80.11 (PaCoRe). 🟢MathVista: 83.97 🟢AIME 2025: 87.66 (SeRe) / 94.43 (PaCoRe) 🟢OCRBench: 86.75 (отлично читает документы). Для сравнения: GLM-4.6V на 106B выдает на MMMU только 75.20. Инженерная хитринка кроется в методологии тестирования. Видите в результатах тестов пометку PaCoRe? PaCoRe (Parallel Coordinated Reasoning): Чтобы получить топовые цифры, модель использует test-time compute. Она запускает 16 параллельных роллаутов, собирает доказательства из разных веток и синтезирует ответ. На инференсе это будет стоить вам в 16 раз "дороже" по ресурсам, чем обычный прогон. В стандартном режиме (SeRe) модель все еще хороша, но уже не выглядит как "убийца всех топов". Кстати, Stepfun честно признались, что в отчетах накосячили с бенчмарками конкурента Qwen3VL-8B из-за неверного max_tokens. Извинились, обещают пересчитать. Это добавляет доверия, но напоминает, что бенчмарки - дело тонкое. В общем, модель - отличный кандидат для локального использования: есть OpenAI-compatible API и vLLM поддерживается (PR вмержили). ⚠️ Если модель зацикливается при генерации - обновите конфиг, там был баг с eos_token_id, который уже пофиксили. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🟡Demo @ai_machinelearning_big_data #AI#ML#VLM#STEP3#StepFunAI