TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15586 · Mar 26

#jupyter_notebook Insanely Fast Whisper is a simple CLI tool that transcribes audio files super quickly on your NVIDIA GPU or Mac using OpenAI's Whisper Large v3 model with optimizations like Flash Attention 2. Install via `pipx install insanely-fast-whisper` and run `insanely-fast-whisper --file-name youraudio.mp3 --flash True` to transcribe 150 minutes of audio in under 98 seconds. You benefit by saving hours on tasks like podcasting or meetings, getting accurate text output fast without cloud costs or slow processing. https://github.com/Vaibhavs10/insanely-fast-whisper

Results

1 similar post found

Search: #speechkit

当前筛选 #speechkit清除筛选
Robot.ltd.co

@robotltdco · Post #256 · 08/21/2025, 11:22 PM

Коллеги, друзья и все, кто следит за рождением Адама и Евы! Вчера случилось то, ради чего всё затевалось: я провёл первые полевые испытания зрения Адама в реальном мире, и он в режиме реального времени не просто видел объекты, а описывал их вслух голосом, как настоящий помощник. Вот как это работает сейчас на железе робота: 1. Глаз: Камера на Raspberry Pi захватывает изображение. 2. Зрение (YOLOv11n, 5 МБ): Сверхлёгкая модель детектирует объекты примерно за 1 сек / кадр. 3. Осмысление (YandexGPT): Получившийся список объектов передается в YandexGPT, который формирует лаконичное и понятное описание сцены. 4. Голос (Yandex SpeechKit): Это описание не печатается в терминале, а сразу синтезируется в чистый, человеческий голос и звучит из динамика робота. 🔊 И это не симуляция — это работающий алгоритм на настоящем железе. Что это значит на практике? Я говорил Адаму:«Посмотри вокруг», и через мгновение он отвечал голосом: «Я вижу человека в помещении, монитор, ноутбук и телефон на столе». Это был не заранее заготовленный ответ, а результат живого-анализа обстановки перед ним. Он буквально делился своими мыслями о том, что видит. Почему это прорыв? Потому что мы перешли от сухих технических тестов к реальному взаимодействию. Робот теперь не бездушный детектор объектов, а сущность, которая способна воспринимать мир и коммуницировать на нашем языке — голосом. Впереди бескрайнее поле для экспериментов с поведением и сценариями использования. Спасибо, что вы с нами на этом пути! Это невероятно вдохновляет. #робототехника#ии#искуственныйинтеллект#yolo#raspberrypi#компьютерноезрение#адам#ева#YandexGPT#SpeechKit#голосовойИИ