TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #654 · 16.11

Пытаюсь решить организационно-логистическую задачу в #Satisfactory. Может быть, умные люди (вы) мне дадите интересные советы. Я уже открыл практически все типы деталей, они довольно сложные, и для производства многих из них нужны целые цепочки: добыть ресурс А в одном месте и ресурс B в другом, потом сделать из них детали C и D, из этой пары получить деталь E, добыть ещё ресурс F, соединить, смешать с водой... В каком-то месте эти цепочки удобно разрывать (то есть не строить всё на одной фабрике, а растаскивать фабрики по карте). Потому что, во-первых, с гигантской базой, производящей все типы всех деталей, банально неудобно работать. Во-вторых, её тяжело масштабировать. Хотя у этого решения есть плюсы, и некоторые так делают, лично я идти по такому пути не хочу. Но в каком месте рвать цепочки? Глобально есть две крайности: 1. Можно делать по фабрике на каждое звено производства. Например, фабрика, которая делает деталь E, должна принимать на вход детали C и D, и всё. Такая схема очень легко масштабируется: небольшую фабрику очень просто расширять. А детали возить между фабриками поездами. Но тогда потребуется типа 100 разных фабрик и очень сложная железнодорожная сеть. 2. Можно в каждую фабрику привозить сырьё. Только то, что невозможно произвести, а можно только добыть. Фабрика делает с нуля из сырья все детали, в том числе для промежуточных звеньев. Такую схему очень легко балансировать: один раз посчитал, сколько нужно сырья, и всё. Но фабрики для сложных деталей будут громоздкие. А ещё если деталь C нужна в десяти местах то придётся десять раз повторить всю цепочку производства детали C, а можно было бы в одном месте делать очень много деталей C и возить. Мне не нравятся оба варианта, значит, рвать цепочку нужно где-то посередине. Но где? #games

Резултати

Намерени 1 подобни публикации

Търсене: #roberta

当前筛选 #roberta清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8817 · 20.10.2025 г., 20:41

⚡️BERT is just a Single Text Diffusion Step Любопытны пост, где автор объяснил на примере очень простую и очевидную, но мощную идею. Он заметил, что то, что мы называем диффузией текста, на самом деле - это просто обобщённая версия классического обучения BERT. Как работаетBERT? В BERT модель берёт текст и маскирует часть слов, а потом учится угадывать, какие слова были скрыты. В диффузии происходит почти то же самое, только шагов больше: на каждом шаге модель немного «портит» текст (добавляет шум), а затем восстанавливает его, всё меньше и меньше теряя смысл, пока не соберёт финальный чистый текст. То есть BERT делает один шаг очистки - угадывает замаскированные слова. А диффузионная модель делает много таких шагов подряд, постепенно превращая случайный набор токенов в осмысленный текст. Барри дообучил RoBERTa, чтобы показать это на практике - и получил настоящий текстовый диффузионный генератор. В примере: - Используется RoBER (улучшенная версия модели BERT,) и датасет WikiText. - На каждом шаге часть токенов заменяется на <MASK>, модель восстанавливает их, потом снова маскирует — и так несколько раз. - После нескольких итераций модель способна генерировать связный текст, даже без автогенеративного декодера (как у GPT). 📈Результаты - Модель генерирует осмысленный текст, хотя и не идеально связный. - Качество улучшалось по мере добавления шагов диффузии. - По времени генерации RoBERTa Diffusion была немного медленнее, чем GPT-2 (~13 сек против 9 сек), но архитектура осталась полностью encoder-only. Автор упоминает, что позже наткнулся на работу DiffusionBERT, где идею реализовали глубже и подтвердили результатами. Главная мысль: BERT можно считать одноступенчатой версией текстовой диффузии. Если добавить больше шагов, то vs получаем диффузионный генератор текста. Если BERT - это один шаг диффузии, то будущее может принадлежать моделям, совмещающим "понимание" и "генерацию" текста в одном процессе. https://nathan.rs/posts/roberta-diffusion/ @ai_machinelearning_big_data #AI#Diffusion#RoBERTa#BERT#LanguageModel#MLM#Research