TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #227 · 20.02

Допустим, вы разработчик, и вам от пользователя приходит строка user-agent с описанием того, каким браузером он пользуется. В этой строке будет что-то типа такого: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36 И вы хотите из неё узнать мажорную версию Chrome, то есть вытащить число 51. Что вы сделаете? Можно, конечно, написать свой парсер, но я уверен, многие воспользуются регулярными выражениями. Я бы воспользовался. Какое выражение сюда подходит? С виду кажется, что вот такое: /Chrome\/(\d\d)\./g Мы ищем слово Chrome и слэш, затем ловим в группу две цифры, после которых стоит точка. Так? По крайней мере, мышление достаточного количества разработчиков именно таково. Зачастую программистам не хватает умения отойти от техзадания на уровень вещественной сути того, с чем они работают. На самом деле число 51 это версия. Версия будет увеличиваться со временем. «Марти, где твоё четырёхмерное воображение?» Если уже прошло 50 версий, то и следующие 50 не за горами, число станет трёхзначным, регулярка или парсер, сделанные под двухзначные числа, перестанут работать. Трехзначная версия Chrome и Firefox приближается уже сейчас. И да, в них падает куча функций на сайтах, включая крупные корпорации: Yahoo, Bethesda, HBO и бог знает сколько сайтов поменьше. Чисто из-за цифры. Это уже назвали «Проблема сотой версии» по аналогии с «Проблемой 2000 года» (программисты записывали год двумя цифрами, 2000 стал неотличим от 1900). К чему это я? Полезно задумываться о физическом воплощении того, что вы представляете в своей программе. Ваш код должен описывать не столько требования заказчика, сколько законы, по которым существует этот объект в реальном мире. #dev

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #bert

当前筛选 #bert清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8817 · 20.10.2025 г., 20:41

⚡️BERT is just a Single Text Diffusion Step Любопытны пост, где автор объяснил на примере очень простую и очевидную, но мощную идею. Он заметил, что то, что мы называем диффузией текста, на самом деле - это просто обобщённая версия классического обучения BERT. Как работаетBERT? В BERT модель берёт текст и маскирует часть слов, а потом учится угадывать, какие слова были скрыты. В диффузии происходит почти то же самое, только шагов больше: на каждом шаге модель немного «портит» текст (добавляет шум), а затем восстанавливает его, всё меньше и меньше теряя смысл, пока не соберёт финальный чистый текст. То есть BERT делает один шаг очистки - угадывает замаскированные слова. А диффузионная модель делает много таких шагов подряд, постепенно превращая случайный набор токенов в осмысленный текст. Барри дообучил RoBERTa, чтобы показать это на практике - и получил настоящий текстовый диффузионный генератор. В примере: - Используется RoBER (улучшенная версия модели BERT,) и датасет WikiText. - На каждом шаге часть токенов заменяется на <MASK>, модель восстанавливает их, потом снова маскирует — и так несколько раз. - После нескольких итераций модель способна генерировать связный текст, даже без автогенеративного декодера (как у GPT). 📈Результаты - Модель генерирует осмысленный текст, хотя и не идеально связный. - Качество улучшалось по мере добавления шагов диффузии. - По времени генерации RoBERTa Diffusion была немного медленнее, чем GPT-2 (~13 сек против 9 сек), но архитектура осталась полностью encoder-only. Автор упоминает, что позже наткнулся на работу DiffusionBERT, где идею реализовали глубже и подтвердили результатами. Главная мысль: BERT можно считать одноступенчатой версией текстовой диффузии. Если добавить больше шагов, то vs получаем диффузионный генератор текста. Если BERT - это один шаг диффузии, то будущее может принадлежать моделям, совмещающим "понимание" и "генерацию" текста в одном процессе. https://nathan.rs/posts/roberta-diffusion/ @ai_machinelearning_big_data #AI#Diffusion#RoBERTa#BERT#LanguageModel#MLM#Research

KillMilk

@killmillk · Post #167 · 05.06.2025 г., 11:00

Исследователи геопространства или сотрудники американских спецслужб, помогающих Украине!? 🤔 ‼️Знакомьтесь, командование специальных операций ВС США (англ. United States Special Operations Command; USSOCOM или SOCOM) ⏩️Список пользователей Rover (Maxar Tehnologies) Armen Kurginyan - arm####@hotmail.com Adam Swain - as####@gmail.com Brian Kuleff - brian.k####@socom.mil Beau Seamans - s####[email protected] Brad Washer - brad####@gmail.com Mike Carter - Mrmi####@gmail.com S Boyd - ####[email protected] Chris D. - chris####@yahoo.com Colby L. - ####[email protected] D. Boardman - daniel.a.bo####@gmail.com Dave Hurd - ####[email protected] Gladhill village - dgla####@gmail.com Grayson Gilliatt - ####[email protected] Grady Graff - ####[email protected] Forrest Hamilton - ####[email protected] Heath B. - he####@gmail.com Justin Carmer - car####@gmail.com J. Lewis - jonathan.le####@gmail.com Joseph Brown - jos####@gmail.com Jonathan Jones - ####[email protected] Joseph Pezzino - jp####@gmail.com Justin Rood - justi####@gmail.com Karam Gill - kar####@gmail.com Nick Corinis - ####[email protected] Pat Berg - maximus####@gmail.com Parker K. - ####[email protected] Sonny Revell - rev####@gmail.com rovertraining - Ro####@socom.mil Rhett Rutledg - rhe####@rhettsmail.com Scott Gregory - bird####@gmail.com Sam Harrington - saman####@gmail.com Skyler W. - s####[email protected] Terrell Burnett - ####[email protected] Thomas Deleon - thom####@gmail.com Tom Wilson - ####[email protected] Travis Gramkov - travis.g####@gmail.com Timothy Ryan Sebert - ####[email protected] Taylor Tharp - trth####@pm.me Tom Wilson - ####[email protected] Tyler Y. - tyler_####@outlook.com Will Fenn - falcon####@gmail.com William Shaw - ####[email protected] Willwachter - ####[email protected] Wlove - waddie.####[email protected] 1st century Viarnes - wvia####[email protected] YankG - ####[email protected] WE ARE KILLNET