TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15614 · Apr 13

#typescript#ai#cuda#mlx#qwen3_tts#qwen3_tts_ui#voice_ai#voice_clone#whisper Voicebox is a free, open-source voice synthesis studio that lets you clone voices, generate speech in 23 languages, and apply audio effects—all running privately on your computer. You can create realistic voice clones from just seconds of audio, use five different text-to-speech engines for different needs, add effects like reverb and pitch shift, and build multi-voice projects with a timeline editor. The key benefit is complete privacy: your voice data and AI models never leave your machine, unlike cloud-based alternatives. It also includes an API for building voice-powered applications and works across Mac, Windows, and Linux with GPU acceleration support. https://github.com/jamiepine/voicebox

Results

1 similar post found

Search: #generativea

当前筛选 #generativea清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8675 · 10/02/2025, 03:11 PM

🔦Генерация изображений на свете, а не на GPU Исследователи из UCLA представили оптическую генеративную модель (Optical Generative Model). Она использует свет и линзы вместо вычислительных блоков - то есть картинки рождаются не на чипах, а в физике. 🔬 Как это работает: 1. Лёгкий цифровой энкодер превращает случайный шум в фазовый узор. 2. Этот узор загружается на оптический модулятор света. 3. Свет проходит через дифракционный декодер и прямо на сенсоре формируется изображение. ✔️ Авторами проведены реальные эксперименты: с помощью видимого света и SLM показаны результаты генерации: - Созданы цифры, лица, бабочки и даже картины в стиле Ван Гога. - Качество сравнимо с современными диффузионными моделями. - Есть две версии: мгновенная (один проход) и итеративная (несколько шагов, как у диффузии). ⚡ Чем интересен такой подход - Подход не требует никакой вычислительной нагрузки. - Супербыстрая генерация: физика света выполняет то, что GPU делает миллиардами операций. - Это открывает путь к энергоэффективному ИИ для edge-устройств: AR/VR, мобильные камеры, компактные сенсоры. ⚠️ Ограничения: - Сложно выравнивать оптические системы. - Ограничения по точности фазовых масок. - Зависимость от качества оборудования (шум, битовая глубина). Но даже с этими проблемами, это первый шаг к новому классу ИИ, где вычисления заменяются чистой оптикой. Nature: https://www.nature.com/articles/s41586-025-09446-5 @ai_machinelearning_big_data #AI#OpticalComputing#Photonics#GenerativeA