TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14963 · Jul 16

#jupyter_notebook SAM 2 is a powerful new AI model that can quickly and accurately separate objects in both images and videos, even if it has never seen them before. It works in real-time, allowing you to select objects with simple prompts like clicks or boxes and refine the results interactively. This makes tasks like video editing, object tracking, and image annotation much easier and faster. SAM 2’s ability to handle complex scenes and track objects smoothly across video frames helps improve creativity and productivity in many fields, from media production to computer vision research. It is open-source and easy to use with Python and PyTorch. https://github.com/facebookresearch/segment-anything

Results

1 similar post found

Search: #controllablegeneration

当前筛选 #controllablegeneration清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8057 · 07/14/2025, 06:02 PM

🧠 Как «вклеить» объект в картинку так, чтобы он выглядел естественно? Это одна из самых сложных задач в семантической генерации: 🔸 нужно сохранить структуру сцены 🔸 вставить объект по текстовому описанию 🔸 и найти уместное место, а не просто налепить поверх Большинство моделей с этим не справляются — объект добавляется не к месту или портит фон. Новый метод Add-it от NVIDIA решает эту задачу без обучения модели. Он расширяет механизм внимания в диффузионных моделях, чтобы учитывать сразу три источника: 1. Оригинальное изображение 2. Текстовый промпт 3. Промежуточную сгенерированную картинку 📌 Такой подход позволяет: – сохранить геометрию сцены – встроить объект туда, где он действительно мог бы быть – не терять мелкие детали и текстуры 📊 Результаты: – Add-it без дообучения обходит supervised‑модели – На новом бенчмарке Additing Affordance показывает SOTA результат по «естественности размещения» – В слепых тестах люди выбирают его в 80% случаев – Улучшает метрики качества генерации 🟠Github: https://github.com/NVlabs/addit 🟠Demo: https://huggingface.co/spaces/nvidia/addit 🟠Paper: https://arxiv.org/abs/2411.07232 🟠Project: https://research.nvidia.com/labs/par/addit/ @ai_machinelearning_big_data #NVIDIA#Diffusion#Addit#StableDiffusion#AIgen#ControllableGeneration