TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #1133 · 14.08

Программисты пока могут не бояться ИИ. В Росатоме работать с ИИ-агентами было нельзя, а вот тут в 2ГИС это даже поощряется, и компания сама оплачивает нужные доступы и лицензии. Практически любые модели на выбор, чаты, Copilot и так далее. Поэтому я попробовал выполнять прям настоящую энтерпрайзную работу при поддержке ИИ, и вот что скажу. Во всех рекламах нейросеток говорят о том, как вам эта сетка позволит создать программу по текстовому описанию без разработчиков. Пожалуй, если создавать программу с нуля и аккуратно итеративно описывать требования, это может сработать. Только дело в том, что в реальной разработке мало работы по созданию с нуля и много работы по внедрению фич и исправлению ошибок. А для этого ИИ-агенту нужно, кроме умения хорошо кодить, ещё и знать (и понимать!) предметную область. И тут начинаются проблемы. Во-первых, в большинстве компаний предметная область нигде целиком не формализована в виде какого-то текста, который можно было бы передать в контекст. Я бы сказал, что единственный более-менее полный документ, описывающий предметную область программы — исходный код этой программы. И хорошо, если она сделана по какому-нибудь DDD, а если там хаотичные процедуры с высоким зацеплением? Во-вторых, и это более важно, мы используем свои человеческие навыки и опыт жизни в окружающем мире, чтобы правильно понимать предметную область. Нужно именно что пожить в мире, чтобы понимать, как пить из пресловутого перевёрнутого стакана. И пока моделькам не получается передать всё многообразие человеческого опыта, люди в относительной безопасности. Ну, кроме тех, чья работа это просто кодить без обдумывания. #dev

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #mobileagents

当前筛选 #mobileagents清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8920 · 01.11.2025 г., 13:25

🆕 Новый сильный GUI-агент: UI-Ins от TongyiLab и RUC Это модель, которая уверенно работает с мобильными интерфейсами и лучше понимает намерения пользователя. Она рассматривает команду как цепочку рассуждений, а не как одно действие, поэтому справляется со сложными задачами стабильнее. Результаты UI-Ins показал 74.1% успешных действий в AndroidWorld. Для сравнения: Gemini 2.5 Computer Use - 69.7%. То есть модель чаще правильно выполняет задачи в реальных интерфейсах. Модель: - пытается понять цель, а не только текст команды - строит несколько вариантов рассуждений - выбирает подходящую стратегию перед действием - адаптируется, если состояние приложения меняется Идет в двух версиях: 7B и 32B. Если вы работаете над агентами, которые должны нажимать кнопки, заполнять формы, открывать приложения и следовать шагам в интерфейсе - UI-Ins стоит добавить в список моделей для тестов. 🤖 UI-Ins-7B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-7B UI-Ins-32B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-32B 📄arXiv: https://modelscope.cn/papers/2510.20286 @ai_machinelearning_big_data #AI#Agents#GUI#MobileAgents#AndroidWorld#LLM