TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #232 · 24.02

Американский философ и когнитивист Дэниел Деннет одним из первых приравнял религию и вирус. Я уже об этом как-то рассказывал: вирус это неодушевлённая конструкция, которая сбивает работу поражённой системы так, чтобы: 1. Нарушать естественные функции этой системы 2. Способствовать самораспространению Нельзя сказать, что вирус думает или что-то делает специально. У него нет концепции зла и агрессии. Это просто механизм, который -- чаще всего из-за случайного совпадения обстоятельств -- способствует разрушению и копированию. Представьте, что вы подбрасываете в воздух детали от Лего, и они по каким-то странным законам при падении соединяются в случайную конструкцию. Вы делаете это очень много раз, вариантов конструкций тоже очень много. В какой-то момент среди прочих конструкций получается робот, который собирает из окружающих его деталей свои копии. Но при этом остальные конструкции он ломает, нарушая их функции. Очевидно, довольно быстро такие роботы потратят всё доступное Лего на себя, и давать им новое Лего будет опасно. Так вот, религия работает по такому же принципу, только её средой выполнения являются не клетки с белками, а когнитивные функции. Она изменяет механизм функционирования разума так, чтобы сбивать некоторые естественные свойства (например, критическое мышление, запрос на эмпирические подтверждения и так далее). Но при этом религиозные люди нередко занимаются активным распространением своих взглядов и обращением еретиков. То есть, другими словами, механизм религии в их мозгу распространяет себя на другие мозги. Как вирус. В широком смысле идеология это тоже религия. У нас нет сведений относительно всех без исключения нюансов существования мира, мы строим себе базовую основу, а затем прямо на неё навешиваем результаты наблюдений. Например, я верю в урбанистику, моя базовая основа это логика в урбанистической теории, статистика из других городов, плюс мои личные ощущения комфорта/дискомфорта, а на неё я уже навешиваю, допустим, отсутствие ненависти к электросамокатам. К сожалению, иногда сам базис идеологии заражён. Это может приводить к тому, что человек даже на самые чудовищные события выдумывает оправдательные объяснения, которые идеологию выгораживают. Я уверен, в стране не сотни и даже не тысячи, а куда больше людей, которые смотрят телевизор, верят пропаганде и объясняют себе сегодняшние события каким-то оправдывающим образом. Например, у меня есть гипотеза, почему старшее поколение может так сильно вестись на откровенно нелепую пропаганду: сознание уже пережило крах идеологии в 91 году и защищается от того, чтобы пережить его снова. Звучит парадоксально: люди уже совершенно точно знают, что по телевизору могут десятилетиями лгать и выдавать ложную картину действительности, и именно из-за этого эти же люди не видят сейчас того же самого. Воспринимайте это как форму болезни. Постарайтесь не ссориться со своими друзьями и близкими. Они могут быть глубоко не правы, а их неправота -- часть общей проблемы, которая привела к сегодняшнему дню. Но они не понимают. Функции их сознания отключены или искажены вирусом пропаганды в комбинации с личными страхами. Их не убедит курс доллара, записи о гибели людей, потеря работы. Даже новая волна пустых полок в магазинах не убедит. Даже понимание того, что их дети уже живут в мире, где возможна война. #life

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #flextok

当前筛选 #flextok清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #7942 · 02.07.2025 г., 09:01

🌟 FlexTok: адаптивная 1D-токенизация изображений от Apple. FlexTok - метод токенизации изображений, который преобразует 2D-изображения в упорядоченные 1D-последовательности переменной длины. Его цель - сократить объем данных, необходимых для обучения генеративных моделей, и при этом оставить достаточную информацию для качественной реконструкции и генерации. В отличие от традиционных подходов, где число токенов фиксировано и зависит только от размера изображения, FlexTok подстраивается под сложность контента: простейшая сцена может кодироваться несколькими токенами, а сложная - десятками и сотнями . FlexTok, это по сути, пайплайн из 3 компонентов: ViT‑энкодер, квантование регистров и маскирование внимания: ViT‑энкодер с набором «регистровых» токенов читает латентные представления VAE‑GAN и конденсирует их в 1D-последовательность до 256 регистров . Затем, с помощью FSQ‑квантования, каждый регистр дискретизируется в код из заранее определенного словаря размером ~64 000. На этом этапе применяется "nested dropout": во время обучения случайно обрезаются последние токены, чтобы модель научилась упорядочивать информацию от грубых форм к деталям. Параллельно применяется авторегрессионная маска внимания: каждый токен в цепочке видит только те, что были до него, и не знает о тех, что идут после. Это заставляет модель генерировать изображения шаг за шагом, от первого токена к последнему, и упрощает ей задачу прогнозирования следующих элементов. Декодер в FlexTok - это модель rectified flow, которая на вход берет укороченные токены и слегка зашумленные латенты VAE и учится предсказывать тот шум, который нужно убрать, чтобы вернуть исходное представление. Чтобы обучение шло быстрее и давало более точные результаты, добавляют REPA‑Loss: он сравнивает промежуточные признаки с векторами из DINOv2‑L. Благодаря этому даже при очень жесткой компрессии (от 1 до 256 токенов), FlexTok успешно восстанавливает детали изображения. FlexTok легко встраивается в текстово‑ориентированные модели и может улучшить соответствие изображения описанию, даже если число токенов меняется. К тому же его адаптивная токенизация применима не только к картинкам, но и к аудио или видео. ▶️Набор токенизаторов: 🟢Flextok_d12_d12_in1k - 12\12 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d18_in1k - 18\18 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_in1k - 18\28 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_dfm - 18\28 слоев энкодер-декодер, датасет DFN. ▶️VAE: 🟠Flextok_vae_c4 - 4 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c8 - 8 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c16 - 16 каналов латента, коэффициент понижающей дискретизации 8. 🟡Страница проекта 🟡Набор на HF 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Tokenizer#Flextok#Apple