TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #254 · 11 јун.

Тип строки в Python имеет очень много удобных методов. Сегодня пост про два таких метода которые чаще всего используются "однобоко". Это методы startswith() и endswith() Самый обычный сценарий использования — проверка, начинается ли строка с указанной подстроки? >>> "some_string".startswith("some") True И аналогичная ситуация с зеркальным вариантом этой функции, проверка совпадения с конца >>> "some_string".endswith("some") False Так они используются в большинстве случаев что я видел. Но у этих функций есть еще два варианта использования. 🔸Сравнение нескольких подстрок Для проверки нескольких подстрок в одной строке обычно вызывают эти функции несколько раз. Но на самом деле достаточно передать кортеж со всеми строками один раз. Если будет хоть одно совпадение то функция вернёт True. >>>"my_image.png".endswith(("jpg", "png", "exr")) True 🔸Диапазон поиска Вторым аргументом можно передать индекс символа с которого следует начать сравнение, а третий аргумент это индекс последнего символа. >>> ".filename.ext".startswith("file", 1) True >>> "file_###.ext".endswith('#', 0, -4) True Индексы можно указать отрицательными, что означает отсчёт с конца. #trics#basic

Hashtags

Резултати

Пронајдени 2 слични објави

Пребарај: #bert

当前筛选 #bert清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8817 · 20.10.2025 г., 20:41

⚡️BERT is just a Single Text Diffusion Step Любопытны пост, где автор объяснил на примере очень простую и очевидную, но мощную идею. Он заметил, что то, что мы называем диффузией текста, на самом деле - это просто обобщённая версия классического обучения BERT. Как работаетBERT? В BERT модель берёт текст и маскирует часть слов, а потом учится угадывать, какие слова были скрыты. В диффузии происходит почти то же самое, только шагов больше: на каждом шаге модель немного «портит» текст (добавляет шум), а затем восстанавливает его, всё меньше и меньше теряя смысл, пока не соберёт финальный чистый текст. То есть BERT делает один шаг очистки - угадывает замаскированные слова. А диффузионная модель делает много таких шагов подряд, постепенно превращая случайный набор токенов в осмысленный текст. Барри дообучил RoBERTa, чтобы показать это на практике - и получил настоящий текстовый диффузионный генератор. В примере: - Используется RoBER (улучшенная версия модели BERT,) и датасет WikiText. - На каждом шаге часть токенов заменяется на <MASK>, модель восстанавливает их, потом снова маскирует — и так несколько раз. - После нескольких итераций модель способна генерировать связный текст, даже без автогенеративного декодера (как у GPT). 📈Результаты - Модель генерирует осмысленный текст, хотя и не идеально связный. - Качество улучшалось по мере добавления шагов диффузии. - По времени генерации RoBERTa Diffusion была немного медленнее, чем GPT-2 (~13 сек против 9 сек), но архитектура осталась полностью encoder-only. Автор упоминает, что позже наткнулся на работу DiffusionBERT, где идею реализовали глубже и подтвердили результатами. Главная мысль: BERT можно считать одноступенчатой версией текстовой диффузии. Если добавить больше шагов, то vs получаем диффузионный генератор текста. Если BERT - это один шаг диффузии, то будущее может принадлежать моделям, совмещающим "понимание" и "генерацию" текста в одном процессе. https://nathan.rs/posts/roberta-diffusion/ @ai_machinelearning_big_data #AI#Diffusion#RoBERTa#BERT#LanguageModel#MLM#Research

KillMilk

@killmillk · Post #167 · 05.06.2025 г., 11:00

Исследователи геопространства или сотрудники американских спецслужб, помогающих Украине!? 🤔 ‼️Знакомьтесь, командование специальных операций ВС США (англ. United States Special Operations Command; USSOCOM или SOCOM) ⏩️Список пользователей Rover (Maxar Tehnologies) Armen Kurginyan - arm####@hotmail.com Adam Swain - as####@gmail.com Brian Kuleff - brian.k####@socom.mil Beau Seamans - s####[email protected] Brad Washer - brad####@gmail.com Mike Carter - Mrmi####@gmail.com S Boyd - ####[email protected] Chris D. - chris####@yahoo.com Colby L. - ####[email protected] D. Boardman - daniel.a.bo####@gmail.com Dave Hurd - ####[email protected] Gladhill village - dgla####@gmail.com Grayson Gilliatt - ####[email protected] Grady Graff - ####[email protected] Forrest Hamilton - ####[email protected] Heath B. - he####@gmail.com Justin Carmer - car####@gmail.com J. Lewis - jonathan.le####@gmail.com Joseph Brown - jos####@gmail.com Jonathan Jones - ####[email protected] Joseph Pezzino - jp####@gmail.com Justin Rood - justi####@gmail.com Karam Gill - kar####@gmail.com Nick Corinis - ####[email protected] Pat Berg - maximus####@gmail.com Parker K. - ####[email protected] Sonny Revell - rev####@gmail.com rovertraining - Ro####@socom.mil Rhett Rutledg - rhe####@rhettsmail.com Scott Gregory - bird####@gmail.com Sam Harrington - saman####@gmail.com Skyler W. - s####[email protected] Terrell Burnett - ####[email protected] Thomas Deleon - thom####@gmail.com Tom Wilson - ####[email protected] Travis Gramkov - travis.g####@gmail.com Timothy Ryan Sebert - ####[email protected] Taylor Tharp - trth####@pm.me Tom Wilson - ####[email protected] Tyler Y. - tyler_####@outlook.com Will Fenn - falcon####@gmail.com William Shaw - ####[email protected] Willwachter - ####[email protected] Wlove - waddie.####[email protected] 1st century Viarnes - wvia####[email protected] YankG - ####[email protected] WE ARE KILLNET