TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15099 · Aug 27

#python#audiobooks#epub#kokoro#python#tts You can easily turn e-books in .epub format into high-quality audiobooks using Audiblez, a free tool that uses Kokoro's natural-sounding text-to-speech voices in many languages. It works on Windows, Mac, and Linux, with options for command line or a simple graphical interface. You can choose different voices, adjust reading speed, and even pick specific chapters to convert. Using a GPU speeds up the process significantly. The final audiobook is saved as an .m4b file, playable on most audiobook apps. This saves you time and money compared to hiring narrators and lets you listen to books hands-free anywhere. https://github.com/santinic/audiblez

Results

1 similar post found

Search: #generativea

当前筛选 #generativea清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8675 · 10/02/2025, 03:11 PM

🔦Генерация изображений на свете, а не на GPU Исследователи из UCLA представили оптическую генеративную модель (Optical Generative Model). Она использует свет и линзы вместо вычислительных блоков - то есть картинки рождаются не на чипах, а в физике. 🔬 Как это работает: 1. Лёгкий цифровой энкодер превращает случайный шум в фазовый узор. 2. Этот узор загружается на оптический модулятор света. 3. Свет проходит через дифракционный декодер и прямо на сенсоре формируется изображение. ✔️ Авторами проведены реальные эксперименты: с помощью видимого света и SLM показаны результаты генерации: - Созданы цифры, лица, бабочки и даже картины в стиле Ван Гога. - Качество сравнимо с современными диффузионными моделями. - Есть две версии: мгновенная (один проход) и итеративная (несколько шагов, как у диффузии). ⚡ Чем интересен такой подход - Подход не требует никакой вычислительной нагрузки. - Супербыстрая генерация: физика света выполняет то, что GPU делает миллиардами операций. - Это открывает путь к энергоэффективному ИИ для edge-устройств: AR/VR, мобильные камеры, компактные сенсоры. ⚠️ Ограничения: - Сложно выравнивать оптические системы. - Ограничения по точности фазовых масок. - Зависимость от качества оборудования (шум, битовая глубина). Но даже с этими проблемами, это первый шаг к новому классу ИИ, где вычисления заменяются чистой оптикой. Nature: https://www.nature.com/articles/s41586-025-09446-5 @ai_machinelearning_big_data #AI#OpticalComputing#Photonics#GenerativeA