TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14684 · May 8

#python#apple_silicon#audio_processing#mlx#multimodal#speech_recognition#speech_synthesis#speech_to_text#text_to_speech#transformers MLX-Audio is a powerful tool for converting text into speech and speech into new audio. It works well on Apple Silicon devices, like M-series chips, making it fast and efficient. You can choose from different languages and voices, and even adjust how fast the speech is. It also includes a web interface where you can see audio in 3D and play your own files. This tool is helpful for making audiobooks, interactive media, and personal projects because it's easy to use and provides high-quality audio quickly. https://github.com/Blaizzy/mlx-audio

Results

1 similar post found

Search: #generativea

当前筛选 #generativea清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8675 · 10/02/2025, 03:11 PM

🔦Генерация изображений на свете, а не на GPU Исследователи из UCLA представили оптическую генеративную модель (Optical Generative Model). Она использует свет и линзы вместо вычислительных блоков - то есть картинки рождаются не на чипах, а в физике. 🔬 Как это работает: 1. Лёгкий цифровой энкодер превращает случайный шум в фазовый узор. 2. Этот узор загружается на оптический модулятор света. 3. Свет проходит через дифракционный декодер и прямо на сенсоре формируется изображение. ✔️ Авторами проведены реальные эксперименты: с помощью видимого света и SLM показаны результаты генерации: - Созданы цифры, лица, бабочки и даже картины в стиле Ван Гога. - Качество сравнимо с современными диффузионными моделями. - Есть две версии: мгновенная (один проход) и итеративная (несколько шагов, как у диффузии). ⚡ Чем интересен такой подход - Подход не требует никакой вычислительной нагрузки. - Супербыстрая генерация: физика света выполняет то, что GPU делает миллиардами операций. - Это открывает путь к энергоэффективному ИИ для edge-устройств: AR/VR, мобильные камеры, компактные сенсоры. ⚠️ Ограничения: - Сложно выравнивать оптические системы. - Ограничения по точности фазовых масок. - Зависимость от качества оборудования (шум, битовая глубина). Но даже с этими проблемами, это первый шаг к новому классу ИИ, где вычисления заменяются чистой оптикой. Nature: https://www.nature.com/articles/s41586-025-09446-5 @ai_machinelearning_big_data #AI#OpticalComputing#Photonics#GenerativeA