7.09.2025 состоялся релизPithon 3.14!
На фоне хайпа про NoGIL всё позабыли про другие фичи. Особенно про Multiple Interpreters, который обещает изоляцию процессов но с эффективностью потоков! На сколько действительно это будет эффективно мы узнаем позже, потому что сейчас это лишь первый релиз с ограничениями и недоработками.
Но что там про NoGIL? Теперь этот режим не экспериментальный, а официально поддерживаемый, но опциональный.
Чтобы запустить без GIL нужна специальная сборка. И перед стартом нужно объявить переменную PYTHON_GIL=0
Для вас я собрал готовый репозиторий где достаточно запустить скрпит, который всё сделает:
▫️ соберет релизный Python 3.14 в новый Docker-образ
▫️ запустит тесты в контейнере (GIL, NoGIL, MultiInterpreter)
▫️ распечатает результаты
Тест очень простой, усложняйте сами)
Вот какие результаты у меня:
=== Running ThreadPoolExecutor GIL ON
TOTAL TIME: 45.48 seconds
=== Running ThreadPoolExecutor GIL OFF
TOTAL TIME: 6.14 seconds
=== Running basic Thread GIL ON
TOTAL TIME: 45.54 seconds
=== Running basic Thread GIL OFF
TOTAL TIME: 4.74 seconds
=== Running with Multi Interpreter
TOTAL TIME: 18.30 seconds
Если сравнивать GIL и NoGIL, то на мои 32 ядра прирост х7-x10 (почему не х32? 🤷). При этом нам обещают что скорости будут расти с новыми релизами.
Режим без GIL похож (визуально) на async, тоже параллельно, тоже не по порядку. Но это не IO! и от того некоторый диссонанс в голове 😵💫, нас учили не так!
Интересно, что чистый Thread работает быстрей чем ThreadPoolExecutor без GIL.
Ну и где-то плачет один адепт мульти-интерпретаторов😭 Теперь нужно искать где они могут пригодиться с такой-то скоростью. Скорее всего своя область применения найдется.
Отдельно я затестил память и вот что вышло на 32 потока:
ThreadPoolExecutor GIL ON
305.228 MB
ThreadPoolExecutor GIL OFF
500.176 MB
basic Thread GIL ON
90.668 MB
basic Thread GIL OFF
472.444 MB
with Multi Interpreter
1267.788 MB
Пока не знаю как к этому относиться)
В целом - радует направление развития!
#release
🆕Транскрипт - новый инструмент для преобразования аудио и видео в текст.
• Поддержка двух моделей: OpenAI и WhisperX
• Обработка аудио и видео файлов длительностью до 1 часа
• Диаризация: автоматическое определение говорящих
• Распознавание речи на различных языках
• Экспорт результата в формате TXT и JSON
💬 Легко транскрибируй голосовые заметки, интервью, подкасты и видеоролики!
❗️Инструмент находится в стадии бета-тестирования. Мы будем рады вашим отзывам и предложениям.
#aitools@gptunnel#whisper@gptunnel
Хороший и быстрый голосовой ввод где угодно без подписки — Handy
Голосом вводить текст гораздо быстрее, чем печатать руками, но не у всех сервисов есть кнопочка «микрофона». А системные методы вроде [Windows]+[H] или [Fn]+[Fn] на маке, ради скорости жертвуют качеством распознавания.
В конце 2024 на основе модели Whisper научились делать расшифровку за несколько секунд с качеством выше среднего.
Самое крутое что модель хорошо распознает современную лексику, бренды, и переключается с английского на русский на лету:
Зуммерские редфлаги и проявленность AI-слопа в куклах Лабуба.
Я в тексте выше ничегоне редактировал, оно само проставило запятые, заглавные, тире и точки исходя из интонации!
Правда чтобы так распознало, пришлось перестать мямлить
🤭
На видосе, например гораздо ближе к тому как оно в реальности работает.
При этом нейронки даже сырой текст обрабатывают хорошо, так что... не проблема? Лишь бы не разучиться писать и говорить внятно такими темпами.
Есть подписочные https://wisprflow.ai и https://superwhisper.com которые на эту модель сверху накручивают «умную обертку» в виде облачных LLM пост-обработчиков и автоматизаций.
Но во первых это еще одна подписка, а во вторых, они слишком глубоко забуриваются в систему, и собирают доп. данные в виде заголовок окон и другой инфы. Короч фе 🥞
Я сам пользуюсь открытым и бесплатным Handy — он супер простой и легкий. Но при желании сверху тоже можно накрутить постобработку через API (типа более приватно, но вопрос доверия по факту)
Я не исопльзую еще потому, что замедляет эффект от быстрой расшифровки.
Единственное ограничение у этой штуки — нужен компьютер с видеокартой, либо ноут вышедший последние 2 года (NPU ядра), либо мак M-серии.
Технически на «чистом» CPU тоже работает качественно, просто обработка у меня на слабом ноуте занимает больше 10 секунд для среднего абзаца, и это выбивает из потока.
Выбирайте Whisper Turbo и настраивайте на горячую клавишу, я себе сделал на CapsLock.
Делитесь если тоже чем то таким пользовались, или если у вас завелось!
p.s пост походу был пророческим
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду
#toolhacks@cogload#whisper@cogload
🧵 1/n I am participating in @Supabase's AI Hackathon and challenging myself to complete "Chat With Any Video" in ≤24 hours. 👨🏻💻 Based on #ChatGPT and #Whisper API, all code will be Open Source, I'll continue to update here during breaks. 🔔 Follow me. https://t.co/Y14z5xOU2x
— JimmyLv.eth (🐣, 🐣) 吕立青 2𐃏22 🇨🇳 (@Jimmy_JingLv) Apr 16, 2023
#book#OpenAI#Whisper
📱
Learn OpenAI Whisper: Transform your understanding of GenAI through robust and accurate speech processing solutions
🏍Josué R. Batista
📶11 MB
Master automatic speech recognition (ASR) with groundbreaking generative AI for unrivaled accuracy and versatility in audio processing Key Features
Uncover the intricate architecture and mechanics behind Whisper's robust speech recognition
Apply Whisper's technology in innovative projects, from audio transcription to voice synthesis
Navigate the practical use of Whisper in real-world scenarios for achieving dynamic tech solutions
-----
Main channel:@repo_science
Coupons:@freecoupons_reposcience
-----
Возможно я уже тоже внутри нейросети.
Есть такая модель для расшифровки аудио от OpenAI, называется Whisper.
Есть обертка для этой модели и она локально на вашем компе расшифровывет любое видео или аудио в текст, бесплатно без смс.
Нужна только современная видеокарта или Мак с процессором М серии. На старых компах на CPU тоже будет работать, но оооочень медленно.
Так вот, у модели есть прикол с русским языком: когда на записи не слышно голоса и играет музыка, в расшифровке модель пишет фразу «субтитры создавал DimaTorzok».
Видимо модель обучали на субтитрах YouTube и она проассоциировала музыку без голоса с этой фразой. На Турецком языке такой же прикол есть, но с другим ютубером.
Скорее всего, какие-то из моих ютубных эфиров или тг заметок тоже уже «в сознании» одной из нейронок.
Ощущения странные. С одной стороны вроде бы и забавно, а с другой стремно — я же не могу контролировать что оно там про меня потенциально запомнило.
Возможно самое время заняться LLM-оптимизацией личного бренда)
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду (2₽)
#нейронка@cogload#ToolReview@cogload
#whisper@cogload
🆒 Не прошло и 24 часов с официальной конференции #OpenAI#DevDay как мы в своем самом популярном в телеграм боте @Plasma_GPT_AI_bot поддержали все новые текстовые модели #chatGPT 4 и даже запустили голосовое общение с ботом (доступен выбор всех голосов).
Новый #whisper v3 очень реалистично озвучивает текст.🔥 В боте есть также доступ к десяткам других популярных текстовых LLM, генерации картинок в 20+ моделях (Midjourney 5.2) и многое другое.
Тестируем и делимся с друзьями! А ваши идеи по улучшениям в комментарии 🚀
#typescript#ai#cross_platform#desktop#openai#rust#transcribe#whisper
You can use Vibe to easily transcribe audio and video files on your own computer without needing the internet. It works offline using OpenAI’s Whisper engine, so your data stays private and never leaves your device. Vibe supports many languages, multiple file formats like SRT for captions, and can transcribe from system audio, microphone, or popular websites. It runs on Mac, Windows, and Linux, and offers features like batch transcription, real-time preview, translation, and AI-powered summaries. This helps you quickly get accurate transcripts while keeping your information secure and under your control.
https://github.com/thewh1teagle/vibe