TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #782 · 17.03

Начал по чуть-чуть смотреть на русскоязычные видеоплощадки, чтобы понять, а существует ли какая-то вменяемая альтернатива, которую, например, могли бы использовать русскоязычные блогеры для доступа к своей аудитории. Как сейчас, после демонстрации Ютубом своей идеологической однобокости, так и в потенциале, если, например, в России Ютуб таки заблокируют. Бывает, что у человека есть какие-то субъективные пожелания к интерфейсу — он считает удобным то, к чему лично он привык, и что лично он использует. Но существуют и вполне объективные фундаментальные вещи. Например, видеосервис должен давать вам навигацию между роликами: возможность отличать просмотренное от непросмотренного, возможность видеть новые выпуски. Не менее важна навигация внутри видео: чтобы сервис запоминал, где вы остановились, и чтобы по ролику можно было перемещаться. Нельзя, например, сказать, что пожелание "Запомнить, на каком месте в видео ты остановился" — личный каприз, вызванный моим собственным паттерном просмотра, который отличается от такового для других людей. Это абсолютно точно одна из фундаментальных функций. Она есть у всех стримингов, и она является определяющей для базового удобства использования сервиса, а её отсутствие способно сделать сервис почти буквально неюзабельным. Я рассмотрел основных претендентов на замену Ютуба: VK с трёх источников (приложение, полный сайт, мобильный сайт), Дзен и RuTube. Главным образом оценивал работу на телефоне, потому что, например, с перемоткой на десктопе проблем никогда не бывает — любой даже самый старый примитивный видеоплеер ещё 20 лет назад позволял мышкой мотать видео, и разработчики сервиса в эту функцию ничего своего не вкладывали. А вкладывали, например, авторы Ютуба, создав функцию перемотки двойным тапом по краю видео на 15 секунд вперёд/назад. Но это нюансы. В таблице есть и не нюансы, а вполне себе базовые вещи, отсутствие которых, честно говоря, повергло меня в шок. #web

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #segmentation

当前筛选 #segmentation清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9132 · 30.11.2025 г., 11:14

🌟MedSAM-3: адаптация SAM 3 для медицины. MedSAM-3 - исследовательский проект, который переносит возможности сегментации по текстовым запросам из общего домена в медицинский. Несмотря на мощь оригинальной SAM 3, тесты показали ее слабую применимость к клиническим данным: базовая модель часто путает анатомические структуры и не понимает специфические термины. MedSAM-3 решает эту проблему, позволяя врачам выделять объекты на снимках МРТ, КТ, УЗИ и гистопатологии с помощью естественного языка. Например, по запросу «сегментируй опухоль молочной железы». В основе - дизайн SAM 3 с двойным трансформером. На обучении заморозили энкодеры изображений и текста, чтобы сохранить сильные визуальные приоритеты оригинала, а вот компоненты детектора прошли SFT на медицинских датасетах. Это позволило сохранить мощный базис оригинальной SAM 3, но добавить ей понимание медицинской специфики. В посттрейн-тестах наилучшую производительность показала конфигурация MedSAM-3 T+I, где текстовые подсказки были объединены с ограничивающими рамками. Такой подход позволил тестовой модели обойти классический U-Net и первую версию MedSAM на бенчмарках BUSI (Dice score - 0.7772) и Kvasir-SEG. 🟡Помимо самой модели, разработчики собрали агентный фреймворк MedSAM-3 Agent. Он использует мультимодальную LLM (в экспериментах - Gemini 3 Pro) в качестве планировщика, который анализирует запрос, выстраивает цепочку рассуждений и итеративно управляет процессом сегментации. В эксперименте c Gemini 3 Pro, на том же тестовом наборе BUSI, метрика Dice выросла с 0.7772 до 0.8064. ⚠️ Проект пока на стадии техотчета, но разработчики обещают опубликовать код и веса модели в ближайшее время. Так что тем, кто занимается ИИ в медицине - рекомендуем следить за репозиторием на Github. 📌Лицензирование: Apache 2.0 License. 🟡Arxiv 🖥Github @ai_machinelearning_big_data #AI#ML#Segmentation#MedSAM3

PHYGITAL+CREATIVE

@phygitalcreative · Post #2746 · 14.04.2023 г., 13:52

SEEM: Segment Everything Everywhere All at Once SEEM позволяет пользователям легко сегментировать изображение, используя промпты различных типов: точки, грубые маски, рамки, языковые подсказки (текст и аудио) и т.д. Говорят, что работает и с видео без дообучения. Гитхаб (кода пока нет) Демо #image2mask, #video2mask, #segmentation#text2mask#audio2mask

Открытый вебинар про сегментацию 29 августа Сегментация – одна из самых сложных штук в анализе данных. И одна из самых опасных. Потому что есть соблазнительное лёгкое решение: быстренько закинуть переменные в K-means, нажать на две кнопки, задать число кластеров, и всё, у тебя уже что-то получилось. А бизнесу потом расхлёбывать. Бизнесу потом жить с этим. 29 августа заглянем под капот сегментации. Вопросы, которые обсудим на вебинаре: — Почему для сегментации недостаточно только кластерного анализа, и нужны также другие методы? Какие? — Почему нельзя полагаться на машинное решение, даже если вы гуру кластерного анализа? — Почему нельзя задавать слишком много переменных на вход? — Зачем обязательно нормировать сегментирующие переменные? И как нормировать? — Кластеры на факторах: да или нет? — Почему K-means – плохой метод, если кластерные центры неизвестны? — Как понять, по каким именно переменным сегменты различаются, а какие переменные лишние? — Как сократить список переменных, чтобы легко идентифицировать сегмент? — Как воспроизводить полученные сегменты в последующих исследованиях? Как всегда, смотрим всё на примерах из нашей исследовательской практики. Спикер: Марк Шафир, CEO & Co-Founder RADAR и RADAR.Школы Формат: Zoom-конференция Дата и время: 29 августа 2024, в 19:00 МСК Участие бесплатное, необходима регистрация #radar_school#lectures#webinar#cluster#segmentation#mark_shaphir