❗️ВАЖНО❗️
🎾Обратная связь по четвертой неделе интенсива
Оставить отзыв на занятия прошлой недели 12 и 15 сентября можно по ссылке: https://forms.gle/HCXZb1B8q77FoGDy8
🎾Обновления в домашних заданиях
В домашней работе №3:
– исправили ответы на вопросы №2 и №7
– добавили дополнительные 2 попытки, чтобы вы могли снова выполнить откорректированный тест (итого 5 разрешенных попыток)
– продлили дедлайн до 24 сентября 23:59 (мск)
В домашней работе №4:
– поправили прием ответа на вопрос №12 (ранее у некоторых студентов возникали трудности)
– добавили дополнительные 2 попытки, чтобы вы могли снова выполнить откорректированный тест (итого 5 разрешенных попыток)
– дедлайн остается тем же: 30 сентября 23:59 (мск)
🎾 У меня возникают разные вопросы по задачам — к кому обратиться?
К хелперам в Discord-комьюнити: мы раздали роль helpers тем, кто готов помогать начинающим с нуля. Хелперы отображаются красным цветом.
Создали 10 мини-групп с 2-3 хелперами в каждой.
В ближайшее время начнем распределять по мини-группам студентов, которые оставили реакции под постом о наборе в мини-группы начинающих.
Этот пост находится в последнем закрепленном сообщении на канале #python-и-математика: реакции все еще можно оставить, если вы хотите в мини-группу.
Хорошей недели!
Команда Mathshub
🆕Транскрипт - новый инструмент для преобразования аудио и видео в текст.
• Поддержка двух моделей: OpenAI и WhisperX
• Обработка аудио и видео файлов длительностью до 1 часа
• Диаризация: автоматическое определение говорящих
• Распознавание речи на различных языках
• Экспорт результата в формате TXT и JSON
💬 Легко транскрибируй голосовые заметки, интервью, подкасты и видеоролики!
❗️Инструмент находится в стадии бета-тестирования. Мы будем рады вашим отзывам и предложениям.
#aitools@gptunnel#whisper@gptunnel
Хороший и быстрый голосовой ввод где угодно без подписки — Handy
Голосом вводить текст гораздо быстрее, чем печатать руками, но не у всех сервисов есть кнопочка «микрофона». А системные методы вроде [Windows]+[H] или [Fn]+[Fn] на маке, ради скорости жертвуют качеством распознавания.
В конце 2024 на основе модели Whisper научились делать расшифровку за несколько секунд с качеством выше среднего.
Самое крутое что модель хорошо распознает современную лексику, бренды, и переключается с английского на русский на лету:
Зуммерские редфлаги и проявленность AI-слопа в куклах Лабуба.
Я в тексте выше ничегоне редактировал, оно само проставило запятые, заглавные, тире и точки исходя из интонации!
Правда чтобы так распознало, пришлось перестать мямлить
🤭
На видосе, например гораздо ближе к тому как оно в реальности работает.
При этом нейронки даже сырой текст обрабатывают хорошо, так что... не проблема? Лишь бы не разучиться писать и говорить внятно такими темпами.
Есть подписочные https://wisprflow.ai и https://superwhisper.com которые на эту модель сверху накручивают «умную обертку» в виде облачных LLM пост-обработчиков и автоматизаций.
Но во первых это еще одна подписка, а во вторых, они слишком глубоко забуриваются в систему, и собирают доп. данные в виде заголовок окон и другой инфы. Короч фе 🥞
Я сам пользуюсь открытым и бесплатным Handy — он супер простой и легкий. Но при желании сверху тоже можно накрутить постобработку через API (типа более приватно, но вопрос доверия по факту)
Я не исопльзую еще потому, что замедляет эффект от быстрой расшифровки.
Единственное ограничение у этой штуки — нужен компьютер с видеокартой, либо ноут вышедший последние 2 года (NPU ядра), либо мак M-серии.
Технически на «чистом» CPU тоже работает качественно, просто обработка у меня на слабом ноуте занимает больше 10 секунд для среднего абзаца, и это выбивает из потока.
Выбирайте Whisper Turbo и настраивайте на горячую клавишу, я себе сделал на CapsLock.
Делитесь если тоже чем то таким пользовались, или если у вас завелось!
p.s пост походу был пророческим
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду
#toolhacks@cogload#whisper@cogload
🧵 1/n I am participating in @Supabase's AI Hackathon and challenging myself to complete "Chat With Any Video" in ≤24 hours. 👨🏻💻 Based on #ChatGPT and #Whisper API, all code will be Open Source, I'll continue to update here during breaks. 🔔 Follow me. https://t.co/Y14z5xOU2x
— JimmyLv.eth (🐣, 🐣) 吕立青 2𐃏22 🇨🇳 (@Jimmy_JingLv) Apr 16, 2023
#book#OpenAI#Whisper
📱
Learn OpenAI Whisper: Transform your understanding of GenAI through robust and accurate speech processing solutions
🏍Josué R. Batista
📶11 MB
Master automatic speech recognition (ASR) with groundbreaking generative AI for unrivaled accuracy and versatility in audio processing Key Features
Uncover the intricate architecture and mechanics behind Whisper's robust speech recognition
Apply Whisper's technology in innovative projects, from audio transcription to voice synthesis
Navigate the practical use of Whisper in real-world scenarios for achieving dynamic tech solutions
-----
Main channel:@repo_science
Coupons:@freecoupons_reposcience
-----
Возможно я уже тоже внутри нейросети.
Есть такая модель для расшифровки аудио от OpenAI, называется Whisper.
Есть обертка для этой модели и она локально на вашем компе расшифровывет любое видео или аудио в текст, бесплатно без смс.
Нужна только современная видеокарта или Мак с процессором М серии. На старых компах на CPU тоже будет работать, но оооочень медленно.
Так вот, у модели есть прикол с русским языком: когда на записи не слышно голоса и играет музыка, в расшифровке модель пишет фразу «субтитры создавал DimaTorzok».
Видимо модель обучали на субтитрах YouTube и она проассоциировала музыку без голоса с этой фразой. На Турецком языке такой же прикол есть, но с другим ютубером.
Скорее всего, какие-то из моих ютубных эфиров или тг заметок тоже уже «в сознании» одной из нейронок.
Ощущения странные. С одной стороны вроде бы и забавно, а с другой стремно — я же не могу контролировать что оно там про меня потенциально запомнило.
Возможно самое время заняться LLM-оптимизацией личного бренда)
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду (2₽)
#нейронка@cogload#ToolReview@cogload
#whisper@cogload
🆒 Не прошло и 24 часов с официальной конференции #OpenAI#DevDay как мы в своем самом популярном в телеграм боте @Plasma_GPT_AI_bot поддержали все новые текстовые модели #chatGPT 4 и даже запустили голосовое общение с ботом (доступен выбор всех голосов).
Новый #whisper v3 очень реалистично озвучивает текст.🔥 В боте есть также доступ к десяткам других популярных текстовых LLM, генерации картинок в 20+ моделях (Midjourney 5.2) и многое другое.
Тестируем и делимся с друзьями! А ваши идеи по улучшениям в комментарии 🚀
#typescript#ai#cross_platform#desktop#openai#rust#transcribe#whisper
You can use Vibe to easily transcribe audio and video files on your own computer without needing the internet. It works offline using OpenAI’s Whisper engine, so your data stays private and never leaves your device. Vibe supports many languages, multiple file formats like SRT for captions, and can transcribe from system audio, microphone, or popular websites. It runs on Mac, Windows, and Linux, and offers features like batch transcription, real-time preview, translation, and AI-powered summaries. This helps you quickly get accurate transcripts while keeping your information secure and under your control.
https://github.com/thewh1teagle/vibe