Последние месяцы у меня прямо заметное количество человек в Телеграме стали постить сторисы, хотя раньше эти люди обитали в публичном поле исключительно в Инсте.
Сторисы, конечно, ужасный формат, и их существование — великое горе для человечества. Но вот появление Инстаграм-инфицированных людей в публичном пространстве Телеги это хороший признак — Инста, по-видимому, перестаёт давать нужный отклик аудитории в России. Возможно, ещё не всё потеряно.
Что касается остальных блокировок, то наконец-то родительские чатики, сообщества домов и общение с арендодателями квартиры вылезут из Вотсапа (хотя у меня удалён уже много лет). Природа очистится.
Ну и хочу прокомментировать новый закон из Австралии, где запретили соцсети подросткам до 16 лет. Давайте так: соцсети это современный цифровой алкоголь. Его можно уметь употреблять в меру, абсолютное большинство людей так и делает. А детям мы запрещаем его, потому что более менее сошлись в оценке их способности к самоконтролю и взвешенным ответственным решениям. То есть направление мысли понятно, и оно даже отзывается во мне. Хотя я бы может поставил 14 лет.
Но совершенно непонятно:
1. Как вообще технически реализовать выполнение этого закона, если устанавливать VPN современные дети учатся раньше, чем читать?
2. Что мешает получать всё то же самое из источников, формально не являющихся соцсетями? Например, в групповых чатиках в мессенджерах (в том числе в официальных школьных мессенджерах, допустим).
#web@clockstackwheels
Поэтому вести борьбу с купцами счастья нужно неустанно и постоянно, как за зарплаты и нормальные условия труда. Победа на этом фронте сулит значительные успехи и на остальных.
Не слушайте игры нарядных дудочников. Думайте. Боритесь. @profcen_bot
#инсайд#мошенничество#mlm#сетевоймаркетинг
⚡️BERT is just a Single Text Diffusion Step
Любопытны пост, где автор объяснил на примере очень простую и очевидную, но мощную идею.
Он заметил, что то, что мы называем диффузией текста, на самом деле - это просто обобщённая версия классического обучения BERT.
Как работаетBERT?
В BERT модель берёт текст и маскирует часть слов, а потом учится угадывать, какие слова были скрыты.
В диффузии происходит почти то же самое, только шагов больше: на каждом шаге модель немного «портит» текст (добавляет шум), а затем восстанавливает его, всё меньше и меньше теряя смысл, пока не соберёт финальный чистый текст.
То есть BERT делает один шаг очистки - угадывает замаскированные слова.
А диффузионная модель делает много таких шагов подряд, постепенно превращая случайный набор токенов в осмысленный текст.
Барри дообучил RoBERTa, чтобы показать это на практике - и получил настоящий текстовый диффузионный генератор.
В примере:
- Используется RoBER (улучшенная версия модели BERT,) и датасет WikiText.
- На каждом шаге часть токенов заменяется на <MASK>,
модель восстанавливает их, потом снова маскирует — и так несколько раз.
- После нескольких итераций модель способна генерировать связный текст,
даже без автогенеративного декодера (как у GPT).
📈Результаты
- Модель генерирует осмысленный текст, хотя и не идеально связный.
- Качество улучшалось по мере добавления шагов диффузии.
- По времени генерации RoBERTa Diffusion была немного медленнее, чем GPT-2 (~13 сек против 9 сек), но архитектура осталась полностью encoder-only.
Автор упоминает, что позже наткнулся на работу DiffusionBERT, где идею реализовали глубже и подтвердили результатами.
Главная мысль:
BERT можно считать одноступенчатой версией текстовой диффузии.
Если добавить больше шагов, то vs получаем диффузионный генератор текста.
Если BERT - это один шаг диффузии, то будущее может принадлежать моделям, совмещающим "понимание" и "генерацию" текста в одном процессе.
https://nathan.rs/posts/roberta-diffusion/
@ai_machinelearning_big_data
#AI#Diffusion#RoBERTa#BERT#LanguageModel#MLM#Research