TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #347 · 17.05

У Star Trek: Strange New Worlds неплохой старт. Может даже получится что-то дельное. Энсон Маунт, который играет капитана, весьма харизматичен и отлично подходит на эту роль. Впрочем, у Star Trek: Discovery тоже был хороший старт с любопытным ответвлённым сюжетом, и интересный персонаж в исполнении Джейсона Айзекса, но потом и он ушел, и всё скатилось в какой-то трэш. Это я вам как адский фанат космофантастики говорю, смотревший все сериалы франшизы, кроме классических. Вообще, сюжет в стиле "Команда космического корабля с пафосом приключается" много где обыграли и в серьёзной и в шуточной форме. Недостатков у подобной модели полно: взрослые люди в повествовании нередко ведут себя очень нелепо и театрально, космос нереалистично перенаселён и цветаст, а "научная" составляющая — просто мешанина технических терминов в духе "Резонанс силовых катушек в варп-двигателе!". Тем не менее, две вещи мне нравятся. Во-первых, художественное отображение тех или иных качеств людей в виде инопланетных рас. А это именно оно: вот вам раса умников и ботаников (вулканцы), вот вам раса агрессивных воителей (клингоны), а вот раса хитроумных мошенников (ференги). Маловероятно, что в реальности другая разумная цивилизация сплошь состояла бы из особей с каким-то характерным выраженным свойством. Если среди людей есть и умники, и агрессоры и мошенники, то совершенно непонятно, почему любая иная жизнь складывалась бы как-то иначе. Среди инопланетян в теории тоже должны быть абсолютно разные представители: умные, глупые, любящие людей, ненавидящие людей, добрые, агрессивные итд. Так что да: пришельцы в этих сериалах это, конечно же, вычурное изображение людей. И оно позволяет хоть и гротескно, но чётко и однозначно показывать некоторые человеческие особенности. Я люблю простоту и прямолинейность, до некоторой степени люблю обобщения, и, как вы помните, считаю людей не такими разными, какими они считают себя сами — так что во мне такие образы отлично откликаются. Во-вторых, акцент на социологии и дипломатии, и фигура капитана, как универсального переговорщика и лидера. Проблемы в большинстве случаев решают не оружием и силой, а попыткой понять и договориться. По сюжету Энтерпрайз вообще научный корабль, имеющий на борту торпеды лишь номинально. Так вот, что внутренние распри команды, что сложности, приходящие извне: как правило решаются или дипломатией или высоким профессионализмом и смекалкой различных членов экипажа. Герои не обладают сверхсилами, но нередко сталкиваются со сверхсильным противником. Нечто похожее нам пытаются показать в "Докторе Кто", но там как-то всё менее строго и лично у меня чаще отключает приостановку неверия. Discovery я бросил, кажется, после второго сезона. Picard вообще не начинал: на мой взгляд это просто эксплуатация фанбазы, пожалели бы престарелых актёров! Посмотрим, как долго Strange New Worlds сможет удерживать хотя бы минимальный интерес. #fiction

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #flextok

当前筛选 #flextok清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #7942 · 02.07.2025 г., 09:01

🌟 FlexTok: адаптивная 1D-токенизация изображений от Apple. FlexTok - метод токенизации изображений, который преобразует 2D-изображения в упорядоченные 1D-последовательности переменной длины. Его цель - сократить объем данных, необходимых для обучения генеративных моделей, и при этом оставить достаточную информацию для качественной реконструкции и генерации. В отличие от традиционных подходов, где число токенов фиксировано и зависит только от размера изображения, FlexTok подстраивается под сложность контента: простейшая сцена может кодироваться несколькими токенами, а сложная - десятками и сотнями . FlexTok, это по сути, пайплайн из 3 компонентов: ViT‑энкодер, квантование регистров и маскирование внимания: ViT‑энкодер с набором «регистровых» токенов читает латентные представления VAE‑GAN и конденсирует их в 1D-последовательность до 256 регистров . Затем, с помощью FSQ‑квантования, каждый регистр дискретизируется в код из заранее определенного словаря размером ~64 000. На этом этапе применяется "nested dropout": во время обучения случайно обрезаются последние токены, чтобы модель научилась упорядочивать информацию от грубых форм к деталям. Параллельно применяется авторегрессионная маска внимания: каждый токен в цепочке видит только те, что были до него, и не знает о тех, что идут после. Это заставляет модель генерировать изображения шаг за шагом, от первого токена к последнему, и упрощает ей задачу прогнозирования следующих элементов. Декодер в FlexTok - это модель rectified flow, которая на вход берет укороченные токены и слегка зашумленные латенты VAE и учится предсказывать тот шум, который нужно убрать, чтобы вернуть исходное представление. Чтобы обучение шло быстрее и давало более точные результаты, добавляют REPA‑Loss: он сравнивает промежуточные признаки с векторами из DINOv2‑L. Благодаря этому даже при очень жесткой компрессии (от 1 до 256 токенов), FlexTok успешно восстанавливает детали изображения. FlexTok легко встраивается в текстово‑ориентированные модели и может улучшить соответствие изображения описанию, даже если число токенов меняется. К тому же его адаптивная токенизация применима не только к картинкам, но и к аудио или видео. ▶️Набор токенизаторов: 🟢Flextok_d12_d12_in1k - 12\12 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d18_in1k - 18\18 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_in1k - 18\28 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_dfm - 18\28 слоев энкодер-декодер, датасет DFN. ▶️VAE: 🟠Flextok_vae_c4 - 4 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c8 - 8 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c16 - 16 каналов латента, коэффициент понижающей дискретизации 8. 🟡Страница проекта 🟡Набор на HF 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Tokenizer#Flextok#Apple