TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #40 · 6.06

Некоторые области удивительным образом игнорируют прогресс в других областях. Для меня самым характерным примером являются, пожалуй, бортовые компьютеры автомобилей. Вчера я ехал на такси Комфорт+, это была вполне приличная и не старая Kia Optima. Водитель параллельно со своим телефоном включил встроенный навигатор, и он ожидаемо оказался очень плох. Мало того, что даже близко не адаптирован под Россию, с убогой не детализированной картой, так ещё и жутко тормозил: FPS анимаций в районе 1-2. Потом я вспомнил, как мы с друзьями в Москве брали в каршеринге Genesis G70 — Южно-Корейский автомобиль премиум-класса с ценой от 2.5 млн рублей. И там стоял адаптированный бортовой компьютер под управлением Android. Надо ли говорить, что скорость его работы была настолько необъяснимо отстойной, что даже самый дешманский ноунейм китайфон справился бы с задачей навигации лучше? Каждый раз, когда я вижу экран бортового компьютера автомобиля, я будто смотрю через маленькое окошко в прошлое 20-летней давности. И по скорости работы и по функциональным возможностям всё поразительно плохо. Можно оправдывать это якобы безопасностью (сторонний софт нельзя ставить, чтобы он не мог повлиять на движение автомобиля), но на деле эти цепи легко разделяются: двигатель и важные узлы в одном месте, а навигатор, информация с датчиков, климат-контроль — в другом, на другом процессоре с другой областью памяти. Автомобильная промышленность в целом довольно консервативна. Поэтому большинство серийных моделей выглядят одинаково скучно, о каких-то крутых новых функциональных фишках мы слышим раз в десятилетие, а какие-то изобретенные полвека назад вещи до сих пор есть далеко не в каждой модели (например, парктроники). Но иногда до абсурда доходит: в тачке за пару лямов компьютер хуже, чем китайский планшет за десятку. #gadgets#life

Резултати

Намерени 3 подобни публикации

Търсене: #segmentation

当前筛选 #segmentation清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9132 · 30.11.2025 г., 11:14

🌟MedSAM-3: адаптация SAM 3 для медицины. MedSAM-3 - исследовательский проект, который переносит возможности сегментации по текстовым запросам из общего домена в медицинский. Несмотря на мощь оригинальной SAM 3, тесты показали ее слабую применимость к клиническим данным: базовая модель часто путает анатомические структуры и не понимает специфические термины. MedSAM-3 решает эту проблему, позволяя врачам выделять объекты на снимках МРТ, КТ, УЗИ и гистопатологии с помощью естественного языка. Например, по запросу «сегментируй опухоль молочной железы». В основе - дизайн SAM 3 с двойным трансформером. На обучении заморозили энкодеры изображений и текста, чтобы сохранить сильные визуальные приоритеты оригинала, а вот компоненты детектора прошли SFT на медицинских датасетах. Это позволило сохранить мощный базис оригинальной SAM 3, но добавить ей понимание медицинской специфики. В посттрейн-тестах наилучшую производительность показала конфигурация MedSAM-3 T+I, где текстовые подсказки были объединены с ограничивающими рамками. Такой подход позволил тестовой модели обойти классический U-Net и первую версию MedSAM на бенчмарках BUSI (Dice score - 0.7772) и Kvasir-SEG. 🟡Помимо самой модели, разработчики собрали агентный фреймворк MedSAM-3 Agent. Он использует мультимодальную LLM (в экспериментах - Gemini 3 Pro) в качестве планировщика, который анализирует запрос, выстраивает цепочку рассуждений и итеративно управляет процессом сегментации. В эксперименте c Gemini 3 Pro, на том же тестовом наборе BUSI, метрика Dice выросла с 0.7772 до 0.8064. ⚠️ Проект пока на стадии техотчета, но разработчики обещают опубликовать код и веса модели в ближайшее время. Так что тем, кто занимается ИИ в медицине - рекомендуем следить за репозиторием на Github. 📌Лицензирование: Apache 2.0 License. 🟡Arxiv 🖥Github @ai_machinelearning_big_data #AI#ML#Segmentation#MedSAM3

PHYGITAL+CREATIVE

@phygitalcreative · Post #2746 · 14.04.2023 г., 13:52

SEEM: Segment Everything Everywhere All at Once SEEM позволяет пользователям легко сегментировать изображение, используя промпты различных типов: точки, грубые маски, рамки, языковые подсказки (текст и аудио) и т.д. Говорят, что работает и с видео без дообучения. Гитхаб (кода пока нет) Демо #image2mask, #video2mask, #segmentation#text2mask#audio2mask

Открытый вебинар про сегментацию 29 августа Сегментация – одна из самых сложных штук в анализе данных. И одна из самых опасных. Потому что есть соблазнительное лёгкое решение: быстренько закинуть переменные в K-means, нажать на две кнопки, задать число кластеров, и всё, у тебя уже что-то получилось. А бизнесу потом расхлёбывать. Бизнесу потом жить с этим. 29 августа заглянем под капот сегментации. Вопросы, которые обсудим на вебинаре: — Почему для сегментации недостаточно только кластерного анализа, и нужны также другие методы? Какие? — Почему нельзя полагаться на машинное решение, даже если вы гуру кластерного анализа? — Почему нельзя задавать слишком много переменных на вход? — Зачем обязательно нормировать сегментирующие переменные? И как нормировать? — Кластеры на факторах: да или нет? — Почему K-means – плохой метод, если кластерные центры неизвестны? — Как понять, по каким именно переменным сегменты различаются, а какие переменные лишние? — Как сократить список переменных, чтобы легко идентифицировать сегмент? — Как воспроизводить полученные сегменты в последующих исследованиях? Как всегда, смотрим всё на примерах из нашей исследовательской практики. Спикер: Марк Шафир, CEO & Co-Founder RADAR и RADAR.Школы Формат: Zoom-конференция Дата и время: 29 августа 2024, в 19:00 МСК Участие бесплатное, необходима регистрация #radar_school#lectures#webinar#cluster#segmentation#mark_shaphir