#jupyter_notebook
Insanely Fast Whisper is a simple CLI tool that transcribes audio files super quickly on your NVIDIA GPU or Mac using OpenAI's Whisper Large v3 model with optimizations like Flash Attention 2. Install via `pipx install insanely-fast-whisper` and run `insanely-fast-whisper --file-name youraudio.mp3 --flash True` to transcribe 150 minutes of audio in under 98 seconds. You benefit by saving hours on tasks like podcasting or meetings, getting accurate text output fast without cloud costs or slow processing.
https://github.com/Vaibhavs10/insanely-fast-whisper
🚀 Google Imagen 4 — доступен всем разработчикам!
Google открыл общий доступ к мощному семейству моделей Imagen 4 для генерации изображений через Gemini API и Google AI Studio.
Ключевое:
1. Три модели:
➡️Imagen 4 Fast: Скорость + низкая цена ($0.02/изображение).
➡️Imagen 4: Флагман, лучшее качество и рендеринг текста.
➡️Imagen 4 Ultra: Максимум детализации (премиум).
2. 2K разрешение: Imagen 4 и Ultra теперь генерируют изображения до 2048x2048 пикселей.
3. Безопасность: Встроенная невидимая водяная марка SynthID для ответственного ИИ.
🔥Итог: Революционные возможности генерации изображений теперь доступны разработчикам для интеграции в свои проекты.
Подробности и документация на официальном сайте Google
#Google#Imagen4#GeminiAPI#ИскусственныйИнтеллект#ГенерацияИзображений#AI
Картинка сделана новой моделью по следующему промпту:
Create a four panel comic strip in a retro style. The first panel should show a friendly cat sitting next to a Chromebook that is pulled up to the website https://ai.dev comic caption: Imagen 4 is now Generally Available! The second panel should show a dog saying “And we’re introducing Imagen 4 FAST which offers low-latency images at just $0.02 per image” panel three should show the cat saying “2K image upscaling is available too!” Panel 4 should show the cat and dog high-fiving with the caption “Try Imagen 4 in AI Studio now!”
https://t.me/semasci