TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #347 · 17.05

У Star Trek: Strange New Worlds неплохой старт. Может даже получится что-то дельное. Энсон Маунт, который играет капитана, весьма харизматичен и отлично подходит на эту роль. Впрочем, у Star Trek: Discovery тоже был хороший старт с любопытным ответвлённым сюжетом, и интересный персонаж в исполнении Джейсона Айзекса, но потом и он ушел, и всё скатилось в какой-то трэш. Это я вам как адский фанат космофантастики говорю, смотревший все сериалы франшизы, кроме классических. Вообще, сюжет в стиле "Команда космического корабля с пафосом приключается" много где обыграли и в серьёзной и в шуточной форме. Недостатков у подобной модели полно: взрослые люди в повествовании нередко ведут себя очень нелепо и театрально, космос нереалистично перенаселён и цветаст, а "научная" составляющая — просто мешанина технических терминов в духе "Резонанс силовых катушек в варп-двигателе!". Тем не менее, две вещи мне нравятся. Во-первых, художественное отображение тех или иных качеств людей в виде инопланетных рас. А это именно оно: вот вам раса умников и ботаников (вулканцы), вот вам раса агрессивных воителей (клингоны), а вот раса хитроумных мошенников (ференги). Маловероятно, что в реальности другая разумная цивилизация сплошь состояла бы из особей с каким-то характерным выраженным свойством. Если среди людей есть и умники, и агрессоры и мошенники, то совершенно непонятно, почему любая иная жизнь складывалась бы как-то иначе. Среди инопланетян в теории тоже должны быть абсолютно разные представители: умные, глупые, любящие людей, ненавидящие людей, добрые, агрессивные итд. Так что да: пришельцы в этих сериалах это, конечно же, вычурное изображение людей. И оно позволяет хоть и гротескно, но чётко и однозначно показывать некоторые человеческие особенности. Я люблю простоту и прямолинейность, до некоторой степени люблю обобщения, и, как вы помните, считаю людей не такими разными, какими они считают себя сами — так что во мне такие образы отлично откликаются. Во-вторых, акцент на социологии и дипломатии, и фигура капитана, как универсального переговорщика и лидера. Проблемы в большинстве случаев решают не оружием и силой, а попыткой понять и договориться. По сюжету Энтерпрайз вообще научный корабль, имеющий на борту торпеды лишь номинально. Так вот, что внутренние распри команды, что сложности, приходящие извне: как правило решаются или дипломатией или высоким профессионализмом и смекалкой различных членов экипажа. Герои не обладают сверхсилами, но нередко сталкиваются со сверхсильным противником. Нечто похожее нам пытаются показать в "Докторе Кто", но там как-то всё менее строго и лично у меня чаще отключает приостановку неверия. Discovery я бросил, кажется, после второго сезона. Picard вообще не начинал: на мой взгляд это просто эксплуатация фанбазы, пожалели бы престарелых актёров! Посмотрим, как долго Strange New Worlds сможет удерживать хотя бы минимальный интерес. #fiction

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #vrag

当前筛选 #vrag清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9841 · 09.04.2026 г., 13:20

🌟 VimRAG: мультимодальный RAG-агент, который держит контекст в виде графа памяти. Tongyi Lab (Alibaba Group) опубликовала VimRAG - фреймворк агентного RAG для работы с текстом, изображениями и видео. Проект развивает прошлогодний VRAG-RL и решает проблему мультимодального RAG: визуальные данные тяжелые по токенам, но семантически разрежены, а классическая ReAct-история забивает контекст шумом и провоцирует повторные бесполезные запросы к поиску. Вместо журнала наблюдений VimRAG моделирует рассуждение как динамический направленный ацикличный граф. Каждая вершина хранит подзапрос, действие агента, текстовое саммари и банк визуальных токенов. Ребра фиксируют логические зависимости между шагами. Такой граф позволяет агенту отличать тупиковую ветку от новой гипотезы и не уходить в циклы повторных поисков. 🟡Поверх графа работает Graph-Modulated Visual Memory Encoding. Бюджет визуальных токенов распределяется с учетом исходящей степени в графе, экспоненциального временного затухания (имитация забывания) и рекурсивной обратной связи от потомков. Ключевым фрагментам достается высокое разрешение, а второстепенные кадры сжимаются или отбрасываются. Для видео задействована способность VLM привязывать содержимое к временной шкале (извлечение ключевых кадров по таймкодам). 🟡Третий компонент - Graph-GPO. GGPO строит критический путь от корня к ответу и накладывает градиентную маску, исключая тупиковые узлы из положительных примеров, а ценные ретривы - из отрицательных. По графикам обучения это дает более быструю сходимость, чем базовый GSPO без прунинга. 🟡Тесты 🟢VimRAG обходит Vanilla RAG, ReAct, VideoRAG, UniversalRAG, MemAgent и Mem1 на 9 бенчмарках (HotpotQA и SQuAD до SlideVQA, MMLongBench, LVBench и XVBench). 🟢На Qwen3-VL-8B-Instruct средний скор поднимается с 43,6 до 50,1, на 4B-версии - с 40,6 до 45,2. При этом средняя длина траектории ниже, чем у ReAct и Mem1: структурированная память съедает меньше действий на ответ. В репозитории доступны: 🟠тренировочный фреймворк VRAG-RL, демо VRAG на тестовой Qwen2.5-VL-7B-VRAG через vLLM (нужна A100 80GB); 🟠демо на API Qwen3.5-Plus через DashScope (с визуализацией DAG рассуждения и расширенным ризонингом). Поисковый движок построен на FAISS и поддерживает эмбеддинги GVE-3B/7B и Qwen3-VL-Embedding-2B/8B. Индексировать можно изображения, PDF (через конвертацию) и нарезанное на чанки видео. Код трейна самого VimRAG обещают выложить после внутреннего ревью Alibaba. 🟡Arxiv 🟡Модель 🖥GitHub @ai_machinelearning_big_data #AI#ML#RAG#VRAG#TongyiLab