TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15546 · Mar 7

#typescript#agent#ai#ai_agents#browser_automation#javascript#typescript#ui_automation#web Page Agent is an open-source tool that lets you control webpages with simple natural language commands, like "Click the login button." It runs directly in your browser with one line of code—no extensions, Python, or screenshots needed—and works with your own AI models for privacy. Use it for fast form filling, AI copilots in apps, accessibility via voice, or multi-page tasks. This saves time by turning clicks into sentences, making complex web apps easy and accessible for everyone. https://github.com/alibaba/page-agent

Results

1 similar post found

Search: #controllablegeneration

当前筛选 #controllablegeneration清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8057 · 07/14/2025, 06:02 PM

🧠 Как «вклеить» объект в картинку так, чтобы он выглядел естественно? Это одна из самых сложных задач в семантической генерации: 🔸 нужно сохранить структуру сцены 🔸 вставить объект по текстовому описанию 🔸 и найти уместное место, а не просто налепить поверх Большинство моделей с этим не справляются — объект добавляется не к месту или портит фон. Новый метод Add-it от NVIDIA решает эту задачу без обучения модели. Он расширяет механизм внимания в диффузионных моделях, чтобы учитывать сразу три источника: 1. Оригинальное изображение 2. Текстовый промпт 3. Промежуточную сгенерированную картинку 📌 Такой подход позволяет: – сохранить геометрию сцены – встроить объект туда, где он действительно мог бы быть – не терять мелкие детали и текстуры 📊 Результаты: – Add-it без дообучения обходит supervised‑модели – На новом бенчмарке Additing Affordance показывает SOTA результат по «естественности размещения» – В слепых тестах люди выбирают его в 80% случаев – Улучшает метрики качества генерации 🟠Github: https://github.com/NVlabs/addit 🟠Demo: https://huggingface.co/spaces/nvidia/addit 🟠Paper: https://arxiv.org/abs/2411.07232 🟠Project: https://research.nvidia.com/labs/par/addit/ @ai_machinelearning_big_data #NVIDIA#Diffusion#Addit#StableDiffusion#AIgen#ControllableGeneration