Windows 11 становится всё менее дружелюбна к юзерам а порой и вовсе не юзабельной:
▫️ постоянные ломающие апдейты которые не дают загрузить систему, откатить ломающие апдейты, и давно уже удаляютфайлыпользователей без спроса. Тенденция в целом уже достаточно давно, включая глобальные сбои и другие неприятности.
▫️ навязчивое продвижение AI шпионовагентовповсюдув системе которых никто не просил.
▫️ всё больше ресурсов ВАШЕГО компа работают не для вас, а в угоду Microsoft. Мелкомягкие официально предлагают купить железо помощней (чтобы они и дальше могли половину мощности использовать по своему усмотрению) а оно что-то не покупается. Рядовой юзер не понимает зачем менять комп который и так норм работает. А глядя на текущие цены на память наступает ощущение что с этим миром что-то не так.
▫️ люди булшитят винду и активно продвигают переход на Linux порой называя винду кучей слопа или даже вирусом, похищающим файлыс целью выкупа (они реально после аплоада и удаления с локала отключают доступ к файлам и требуют купить подписку). А сам Microsoft переименован в Microslop. Появляются даже тулзы для очистки системы от этого слопа.
▫️ Microsoft уже не скрывает, что ваши данные уже не ваши, даже зашифрованные, ибо ваши пароли давно уже хранятся где надо и доступны кому надо.
▫️ При всех этих факапах они закрыли поддержку Windows 10 не давая возможности откатиться на что-то более стабильное.
То есть сами Microsoft стали катализатором поиска альтернатив.
Сам я уже на Linux уже более 7 лет как на основной системе, дома винда есть только в виртуалке для тестов клиентского софта. Расскажите, как у вас обстоят дела на винде? Вы пользуетесь системой или боретесь с ней?
#offtop
🆕Транскрипт - новый инструмент для преобразования аудио и видео в текст.
• Поддержка двух моделей: OpenAI и WhisperX
• Обработка аудио и видео файлов длительностью до 1 часа
• Диаризация: автоматическое определение говорящих
• Распознавание речи на различных языках
• Экспорт результата в формате TXT и JSON
💬 Легко транскрибируй голосовые заметки, интервью, подкасты и видеоролики!
❗️Инструмент находится в стадии бета-тестирования. Мы будем рады вашим отзывам и предложениям.
#aitools@gptunnel#whisper@gptunnel
Хороший и быстрый голосовой ввод где угодно без подписки — Handy
Голосом вводить текст гораздо быстрее, чем печатать руками, но не у всех сервисов есть кнопочка «микрофона». А системные методы вроде [Windows]+[H] или [Fn]+[Fn] на маке, ради скорости жертвуют качеством распознавания.
В конце 2024 на основе модели Whisper научились делать расшифровку за несколько секунд с качеством выше среднего.
Самое крутое что модель хорошо распознает современную лексику, бренды, и переключается с английского на русский на лету:
Зуммерские редфлаги и проявленность AI-слопа в куклах Лабуба.
Я в тексте выше ничегоне редактировал, оно само проставило запятые, заглавные, тире и точки исходя из интонации!
Правда чтобы так распознало, пришлось перестать мямлить
🤭
На видосе, например гораздо ближе к тому как оно в реальности работает.
При этом нейронки даже сырой текст обрабатывают хорошо, так что... не проблема? Лишь бы не разучиться писать и говорить внятно такими темпами.
Есть подписочные https://wisprflow.ai и https://superwhisper.com которые на эту модель сверху накручивают «умную обертку» в виде облачных LLM пост-обработчиков и автоматизаций.
Но во первых это еще одна подписка, а во вторых, они слишком глубоко забуриваются в систему, и собирают доп. данные в виде заголовок окон и другой инфы. Короч фе 🥞
Я сам пользуюсь открытым и бесплатным Handy — он супер простой и легкий. Но при желании сверху тоже можно накрутить постобработку через API (типа более приватно, но вопрос доверия по факту)
Я не исопльзую еще потому, что замедляет эффект от быстрой расшифровки.
Единственное ограничение у этой штуки — нужен компьютер с видеокартой, либо ноут вышедший последние 2 года (NPU ядра), либо мак M-серии.
Технически на «чистом» CPU тоже работает качественно, просто обработка у меня на слабом ноуте занимает больше 10 секунд для среднего абзаца, и это выбивает из потока.
Выбирайте Whisper Turbo и настраивайте на горячую клавишу, я себе сделал на CapsLock.
Делитесь если тоже чем то таким пользовались, или если у вас завелось!
p.s пост походу был пророческим
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду
#toolhacks@cogload#whisper@cogload
🧵 1/n I am participating in @Supabase's AI Hackathon and challenging myself to complete "Chat With Any Video" in ≤24 hours. 👨🏻💻 Based on #ChatGPT and #Whisper API, all code will be Open Source, I'll continue to update here during breaks. 🔔 Follow me. https://t.co/Y14z5xOU2x
— JimmyLv.eth (🐣, 🐣) 吕立青 2𐃏22 🇨🇳 (@Jimmy_JingLv) Apr 16, 2023
#book#OpenAI#Whisper
📱
Learn OpenAI Whisper: Transform your understanding of GenAI through robust and accurate speech processing solutions
🏍Josué R. Batista
📶11 MB
Master automatic speech recognition (ASR) with groundbreaking generative AI for unrivaled accuracy and versatility in audio processing Key Features
Uncover the intricate architecture and mechanics behind Whisper's robust speech recognition
Apply Whisper's technology in innovative projects, from audio transcription to voice synthesis
Navigate the practical use of Whisper in real-world scenarios for achieving dynamic tech solutions
-----
Main channel:@repo_science
Coupons:@freecoupons_reposcience
-----
Возможно я уже тоже внутри нейросети.
Есть такая модель для расшифровки аудио от OpenAI, называется Whisper.
Есть обертка для этой модели и она локально на вашем компе расшифровывет любое видео или аудио в текст, бесплатно без смс.
Нужна только современная видеокарта или Мак с процессором М серии. На старых компах на CPU тоже будет работать, но оооочень медленно.
Так вот, у модели есть прикол с русским языком: когда на записи не слышно голоса и играет музыка, в расшифровке модель пишет фразу «субтитры создавал DimaTorzok».
Видимо модель обучали на субтитрах YouTube и она проассоциировала музыку без голоса с этой фразой. На Турецком языке такой же прикол есть, но с другим ютубером.
Скорее всего, какие-то из моих ютубных эфиров или тг заметок тоже уже «в сознании» одной из нейронок.
Ощущения странные. С одной стороны вроде бы и забавно, а с другой стремно — я же не могу контролировать что оно там про меня потенциально запомнило.
Возможно самое время заняться LLM-оптимизацией личного бренда)
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду (2₽)
#нейронка@cogload#ToolReview@cogload
#whisper@cogload
🆒 Не прошло и 24 часов с официальной конференции #OpenAI#DevDay как мы в своем самом популярном в телеграм боте @Plasma_GPT_AI_bot поддержали все новые текстовые модели #chatGPT 4 и даже запустили голосовое общение с ботом (доступен выбор всех голосов).
Новый #whisper v3 очень реалистично озвучивает текст.🔥 В боте есть также доступ к десяткам других популярных текстовых LLM, генерации картинок в 20+ моделях (Midjourney 5.2) и многое другое.
Тестируем и делимся с друзьями! А ваши идеи по улучшениям в комментарии 🚀
#typescript#ai#cross_platform#desktop#openai#rust#transcribe#whisper
You can use Vibe to easily transcribe audio and video files on your own computer without needing the internet. It works offline using OpenAI’s Whisper engine, so your data stays private and never leaves your device. Vibe supports many languages, multiple file formats like SRT for captions, and can transcribe from system audio, microphone, or popular websites. It runs on Mac, Windows, and Linux, and offers features like batch transcription, real-time preview, translation, and AI-powered summaries. This helps you quickly get accurate transcripts while keeping your information secure and under your control.
https://github.com/thewh1teagle/vibe