TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #441 · 9.07

Раньше был Букинг для аренды отелей, а теперь Островок и похожие сервисы. И там везде есть рейтинг от 0 до 10. Как я понимаю, на рейтинг сильно смотрят, когда принимают решение, какой отель взять. Ну я вот точно смотрю. По пути туда в Петрозаводске мы останавливались в Piter Inn — крутой топовый отель за много денег. У него был ожидаемо высокий рейтинг, и он этот рейтинг оправдывает. По пути обратно мы, как вы знаете, остановились нештатно. Крутые отели были заняты, и пришлось взять дешёвый. Он был ожидаемо убогонький по обстановке и оснащению, с низким рейтингом. Однако, персонал в последнем отеле общался с нами очень вежливо и выполнил нестандартные просьбы, бельё было чистое, вообще никаких претензий у нас не возникло. И я вот подумал: в рамках своей цены дешёвый отель тоже себя полностью оправдывает. Он просто существует в другом классе — дешёвые номера, чтобы быстро переночевать. Но внутри своего класса он справляется хорошо. Должен ли у него быть ниже рейтинг? С одной стороны вроде да, ведь рейтинг используется для сравнения отелей между собой, и дешёвый точно проигрывает дорогому по всем параметрам, кроме цены. С другой стороны, если у нас рейтинговая шкала абсолютная, то как вообще награждать и продвигать хорошие вещи в более дешёвых классах? Тогда 9-10 будет только у супер дорогих, а что-то попроще — даже образцовое — упрется в потолок. В такси же в экономе у водителя может быть 5 звёзд, если машина чистая, а сам он аккуратно водит. #life

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #mobileagents

当前筛选 #mobileagents清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8920 · 01.11.2025 г., 13:25

🆕 Новый сильный GUI-агент: UI-Ins от TongyiLab и RUC Это модель, которая уверенно работает с мобильными интерфейсами и лучше понимает намерения пользователя. Она рассматривает команду как цепочку рассуждений, а не как одно действие, поэтому справляется со сложными задачами стабильнее. Результаты UI-Ins показал 74.1% успешных действий в AndroidWorld. Для сравнения: Gemini 2.5 Computer Use - 69.7%. То есть модель чаще правильно выполняет задачи в реальных интерфейсах. Модель: - пытается понять цель, а не только текст команды - строит несколько вариантов рассуждений - выбирает подходящую стратегию перед действием - адаптируется, если состояние приложения меняется Идет в двух версиях: 7B и 32B. Если вы работаете над агентами, которые должны нажимать кнопки, заполнять формы, открывать приложения и следовать шагам в интерфейсе - UI-Ins стоит добавить в список моделей для тестов. 🤖 UI-Ins-7B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-7B UI-Ins-32B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-32B 📄arXiv: https://modelscope.cn/papers/2510.20286 @ai_machinelearning_big_data #AI#Agents#GUI#MobileAgents#AndroidWorld#LLM