TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14963 · Jul 16

#jupyter_notebook SAM 2 is a powerful new AI model that can quickly and accurately separate objects in both images and videos, even if it has never seen them before. It works in real-time, allowing you to select objects with simple prompts like clicks or boxes and refine the results interactively. This makes tasks like video editing, object tracking, and image annotation much easier and faster. SAM 2’s ability to handle complex scenes and track objects smoothly across video frames helps improve creativity and productivity in many fields, from media production to computer vision research. It is open-source and easy to use with Python and PyTorch. https://github.com/facebookresearch/segment-anything

Results

1 similar post found

Search: #generativea

当前筛选 #generativea清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8675 · 10/02/2025, 03:11 PM

🔦Генерация изображений на свете, а не на GPU Исследователи из UCLA представили оптическую генеративную модель (Optical Generative Model). Она использует свет и линзы вместо вычислительных блоков - то есть картинки рождаются не на чипах, а в физике. 🔬 Как это работает: 1. Лёгкий цифровой энкодер превращает случайный шум в фазовый узор. 2. Этот узор загружается на оптический модулятор света. 3. Свет проходит через дифракционный декодер и прямо на сенсоре формируется изображение. ✔️ Авторами проведены реальные эксперименты: с помощью видимого света и SLM показаны результаты генерации: - Созданы цифры, лица, бабочки и даже картины в стиле Ван Гога. - Качество сравнимо с современными диффузионными моделями. - Есть две версии: мгновенная (один проход) и итеративная (несколько шагов, как у диффузии). ⚡ Чем интересен такой подход - Подход не требует никакой вычислительной нагрузки. - Супербыстрая генерация: физика света выполняет то, что GPU делает миллиардами операций. - Это открывает путь к энергоэффективному ИИ для edge-устройств: AR/VR, мобильные камеры, компактные сенсоры. ⚠️ Ограничения: - Сложно выравнивать оптические системы. - Ограничения по точности фазовых масок. - Зависимость от качества оборудования (шум, битовая глубина). Но даже с этими проблемами, это первый шаг к новому классу ИИ, где вычисления заменяются чистой оптикой. Nature: https://www.nature.com/articles/s41586-025-09446-5 @ai_machinelearning_big_data #AI#OpticalComputing#Photonics#GenerativeA