TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #217 · 12.02

Попробовал Obsidian. Это такой заметочник. И в итоге буду переходить на него с Notion. Вообще, с заметочниками дела плохи. Когда-то появился Evernote и занял лидирующее положение на рынке даже при всём своём неудобстве. Он кривой, кроссплатформенность реализована плохо (на части платформ то те, то другие функции недоступны), система организации урезана и приводит к беспорядку, а в клиентах много визуального мусора в UI. И тем не менее, это был один из первых облачных заметочников — важный шаг для рынка. Удивительно, как долго человечество шло к идее, что нужно сделать «Блокнот», но под все платформы, включая телефоны, и с синхронизацией через сеть. Потом пришел Notion, который поначалу топтался на месте из-за сомнительной ценовой политики. Но в результате правильных реформ стал процветающим стартапом, использующимся сейчас в огромном количестве команд и проектов. Даже смог позволить себе сделать безлимитную бесплатную версию. По сравнению с Evernote это был глоток свежего воздуха: мусора в UI на порядки меньше, функциональность одинаковая на всех платформах, полноценная древовидная организация любой глубины, почти нормальная поддержка Markdown. Впрочем, что-то не дало авторам пойти дальше и избавить свой сервис от серьёзных UX-косяков. Только ленивый не ругает Notion за ужасно низкую скорость работы. Он долго грузится, долго открывает файлы и относительно долго реагирует на ввод — для заметочника это критически важно. На всех платформах использовали гибридную разработку (HTML внутри контейнера как будто от нормального нативного приложения) со всеми худшими её чертами: проект тяжёлый и неповоротливый. Это не говоря уже о том, что и десктопное и мобильное приложение по сути окно в веб. Оно не будет работать без интернета, а сессия сбрасывается раз в несколько дней. В итоге вы хотите добавить заметку, открываете клиент, и он мало того что грузится долго, так ещё и показывает вам окно авторизации. Нужно переходить в браузер, ждать, пока авторизация пройдёт там, возвращаться в клиент... в общем, вы уже забудете, что за заметку хотели. После пары лет использования Notion я поймал себя на том, что на телефоне открываю встроенные системные заметки, а потом копирую текст оттуда в Telegram, чтобы он был доступен отовсюду. На компьютере же быстрее открыть Notepad++. Короче, Notion со своей задачей быть заметочником на каждый день не справляется. И вот, Obsidian. По сути это продвинутый блокнот с поддержкой Markdown. Ладно, у него есть какая-то фишка с организацией заметок по методу Zettelkasten, но я пока туда не смотрел, да и сам метод требует определённого подхода, который я пока что не применяю. Так что это блокнот, умеющий выводить дерево и отображать Markdown-форматирование. Он очень быстрый, грузится не молниеносно, но адекватно, и сам интерфейс работает очень шустро. Не знаю, HTML там или нет (по виду кажется, что да), но авторы явно поработали над оптимизацией. Конечно же, есть приложения под телефоны, и они тоже весьма комфортны по скорости. Что касается синхронизации, то это платная функция, и, на мой взгляд, необоснованно дорогая: $8 в месяц (сама программа бесплатная). Здесь бы разговор можно было закончить — при всех прелестях сервис без синхронизации между устройствами в 2022 году это как обувь на одну ногу. Но мне повезло: моё NAS-хранилище умеет создавать виртуальное облако. Да, возможно у какого-то из облаков на рынке тоже есть все нужные функции, но, например, Яндекс Диск на телефоне синхронизирует только видео и фотки, а произвольные папки не может. А вот Synology прям спасло. Что ещё хорошего. Notion был перегружен лишними функциями. Но если они всё-таки нужны, у Obsidian отличная система плагинов, поддерживаемых независимыми разработчиками. Уже есть множество решений на любой вкус. Например, в Notion я мог пошарить другому человеку выбранную заметку. А здесь нашёл плагин, который трансформирует заметку в Github Gist. Удобно: Markdown там совместимый, Gist бесплатный и без рекламы. Короче, пока нравится. Вот этот пост сейчас пишу в нём на компьютере, а начал на телефоне днём. То, что нужно. #web#tools

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #flextok

当前筛选 #flextok清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #7942 · 02.07.2025 г., 09:01

🌟 FlexTok: адаптивная 1D-токенизация изображений от Apple. FlexTok - метод токенизации изображений, который преобразует 2D-изображения в упорядоченные 1D-последовательности переменной длины. Его цель - сократить объем данных, необходимых для обучения генеративных моделей, и при этом оставить достаточную информацию для качественной реконструкции и генерации. В отличие от традиционных подходов, где число токенов фиксировано и зависит только от размера изображения, FlexTok подстраивается под сложность контента: простейшая сцена может кодироваться несколькими токенами, а сложная - десятками и сотнями . FlexTok, это по сути, пайплайн из 3 компонентов: ViT‑энкодер, квантование регистров и маскирование внимания: ViT‑энкодер с набором «регистровых» токенов читает латентные представления VAE‑GAN и конденсирует их в 1D-последовательность до 256 регистров . Затем, с помощью FSQ‑квантования, каждый регистр дискретизируется в код из заранее определенного словаря размером ~64 000. На этом этапе применяется "nested dropout": во время обучения случайно обрезаются последние токены, чтобы модель научилась упорядочивать информацию от грубых форм к деталям. Параллельно применяется авторегрессионная маска внимания: каждый токен в цепочке видит только те, что были до него, и не знает о тех, что идут после. Это заставляет модель генерировать изображения шаг за шагом, от первого токена к последнему, и упрощает ей задачу прогнозирования следующих элементов. Декодер в FlexTok - это модель rectified flow, которая на вход берет укороченные токены и слегка зашумленные латенты VAE и учится предсказывать тот шум, который нужно убрать, чтобы вернуть исходное представление. Чтобы обучение шло быстрее и давало более точные результаты, добавляют REPA‑Loss: он сравнивает промежуточные признаки с векторами из DINOv2‑L. Благодаря этому даже при очень жесткой компрессии (от 1 до 256 токенов), FlexTok успешно восстанавливает детали изображения. FlexTok легко встраивается в текстово‑ориентированные модели и может улучшить соответствие изображения описанию, даже если число токенов меняется. К тому же его адаптивная токенизация применима не только к картинкам, но и к аудио или видео. ▶️Набор токенизаторов: 🟢Flextok_d12_d12_in1k - 12\12 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d18_in1k - 18\18 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_in1k - 18\28 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_dfm - 18\28 слоев энкодер-декодер, датасет DFN. ▶️VAE: 🟠Flextok_vae_c4 - 4 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c8 - 8 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c16 - 16 каналов латента, коэффициент понижающей дискретизации 8. 🟡Страница проекта 🟡Набор на HF 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Tokenizer#Flextok#Apple