Попробовал, наконец, классную математическую настольную игру "Машина Тьюринга".
На самом деле не столько игра, сколько головоломка, которую вы можете решать в одиночку, совместно или соревнуясь. Она совершенно гениально сделана, и я не до конца понимаю, как именно, но она работает и приносит много удовольствия.
Каждая задача в игре — трехзначное число с цифрами 1..5, зашифрованное в наборе карточек. Карточки двух видов: выражение и его валидатор. Выражение, например, может быть таким: "Вторая цифра меньше трех". Вы выдвигаете гипотезу, каким именно будет число-ответ. А дальше происходит магия — каждое такое число собирается из трёх перфокарт с отверстиями, вы прикладываете к сборке валидатор, и в единственном оставшемся отверстии видете бинарный результат: истина или ложь. Таким образом, получаете информацию о том, справедливо ли выражение для загаданного числа.
Ход за ходом вы должны выбирать самые эффективные гипотезы и выражения, которые отсекут больше всего неверных вариантов. В какой-то момент информации для однозначного ответа становится достаточно. Чем меньше ходов вы потратили, тем лучше.
Если вы нерд и любите фокусы с цифрами, то это прям мастхэв. Играется очень приятно, и вызывает неподдельный кайф каждый раз, когда вы собираете из кусочков ответ, хотя за мгновение до этого может казаться, что до решения ещё очень далеко.
Если же вы не фанат подобного, то подарите коробку знакомому математику, он будет рад!
#games
🆕Транскрипт - новый инструмент для преобразования аудио и видео в текст.
• Поддержка двух моделей: OpenAI и WhisperX
• Обработка аудио и видео файлов длительностью до 1 часа
• Диаризация: автоматическое определение говорящих
• Распознавание речи на различных языках
• Экспорт результата в формате TXT и JSON
💬 Легко транскрибируй голосовые заметки, интервью, подкасты и видеоролики!
❗️Инструмент находится в стадии бета-тестирования. Мы будем рады вашим отзывам и предложениям.
#aitools@gptunnel#whisper@gptunnel
Хороший и быстрый голосовой ввод где угодно без подписки — Handy
Голосом вводить текст гораздо быстрее, чем печатать руками, но не у всех сервисов есть кнопочка «микрофона». А системные методы вроде [Windows]+[H] или [Fn]+[Fn] на маке, ради скорости жертвуют качеством распознавания.
В конце 2024 на основе модели Whisper научились делать расшифровку за несколько секунд с качеством выше среднего.
Самое крутое что модель хорошо распознает современную лексику, бренды, и переключается с английского на русский на лету:
Зуммерские редфлаги и проявленность AI-слопа в куклах Лабуба.
Я в тексте выше ничегоне редактировал, оно само проставило запятые, заглавные, тире и точки исходя из интонации!
Правда чтобы так распознало, пришлось перестать мямлить
🤭
На видосе, например гораздо ближе к тому как оно в реальности работает.
При этом нейронки даже сырой текст обрабатывают хорошо, так что... не проблема? Лишь бы не разучиться писать и говорить внятно такими темпами.
Есть подписочные https://wisprflow.ai и https://superwhisper.com которые на эту модель сверху накручивают «умную обертку» в виде облачных LLM пост-обработчиков и автоматизаций.
Но во первых это еще одна подписка, а во вторых, они слишком глубоко забуриваются в систему, и собирают доп. данные в виде заголовок окон и другой инфы. Короч фе 🥞
Я сам пользуюсь открытым и бесплатным Handy — он супер простой и легкий. Но при желании сверху тоже можно накрутить постобработку через API (типа более приватно, но вопрос доверия по факту)
Я не исопльзую еще потому, что замедляет эффект от быстрой расшифровки.
Единственное ограничение у этой штуки — нужен компьютер с видеокартой, либо ноут вышедший последние 2 года (NPU ядра), либо мак M-серии.
Технически на «чистом» CPU тоже работает качественно, просто обработка у меня на слабом ноуте занимает больше 10 секунд для среднего абзаца, и это выбивает из потока.
Выбирайте Whisper Turbo и настраивайте на горячую клавишу, я себе сделал на CapsLock.
Делитесь если тоже чем то таким пользовались, или если у вас завелось!
p.s пост походу был пророческим
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду
#toolhacks@cogload#whisper@cogload
🧵 1/n I am participating in @Supabase's AI Hackathon and challenging myself to complete "Chat With Any Video" in ≤24 hours. 👨🏻💻 Based on #ChatGPT and #Whisper API, all code will be Open Source, I'll continue to update here during breaks. 🔔 Follow me. https://t.co/Y14z5xOU2x
— JimmyLv.eth (🐣, 🐣) 吕立青 2𐃏22 🇨🇳 (@Jimmy_JingLv) Apr 16, 2023
#book#OpenAI#Whisper
📱
Learn OpenAI Whisper: Transform your understanding of GenAI through robust and accurate speech processing solutions
🏍Josué R. Batista
📶11 MB
Master automatic speech recognition (ASR) with groundbreaking generative AI for unrivaled accuracy and versatility in audio processing Key Features
Uncover the intricate architecture and mechanics behind Whisper's robust speech recognition
Apply Whisper's technology in innovative projects, from audio transcription to voice synthesis
Navigate the practical use of Whisper in real-world scenarios for achieving dynamic tech solutions
-----
Main channel:@repo_science
Coupons:@freecoupons_reposcience
-----
Возможно я уже тоже внутри нейросети.
Есть такая модель для расшифровки аудио от OpenAI, называется Whisper.
Есть обертка для этой модели и она локально на вашем компе расшифровывет любое видео или аудио в текст, бесплатно без смс.
Нужна только современная видеокарта или Мак с процессором М серии. На старых компах на CPU тоже будет работать, но оооочень медленно.
Так вот, у модели есть прикол с русским языком: когда на записи не слышно голоса и играет музыка, в расшифровке модель пишет фразу «субтитры создавал DimaTorzok».
Видимо модель обучали на субтитрах YouTube и она проассоциировала музыку без голоса с этой фразой. На Турецком языке такой же прикол есть, но с другим ютубером.
Скорее всего, какие-то из моих ютубных эфиров или тг заметок тоже уже «в сознании» одной из нейронок.
Ощущения странные. С одной стороны вроде бы и забавно, а с другой стремно — я же не могу контролировать что оно там про меня потенциально запомнило.
Возможно самое время заняться LLM-оптимизацией личного бренда)
🎤Ссылки на утро — второй канал
⏲Устойчивый VPN за звезду (2₽)
#нейронка@cogload#ToolReview@cogload
#whisper@cogload
🆒 Не прошло и 24 часов с официальной конференции #OpenAI#DevDay как мы в своем самом популярном в телеграм боте @Plasma_GPT_AI_bot поддержали все новые текстовые модели #chatGPT 4 и даже запустили голосовое общение с ботом (доступен выбор всех голосов).
Новый #whisper v3 очень реалистично озвучивает текст.🔥 В боте есть также доступ к десяткам других популярных текстовых LLM, генерации картинок в 20+ моделях (Midjourney 5.2) и многое другое.
Тестируем и делимся с друзьями! А ваши идеи по улучшениям в комментарии 🚀
#typescript#ai#cross_platform#desktop#openai#rust#transcribe#whisper
You can use Vibe to easily transcribe audio and video files on your own computer without needing the internet. It works offline using OpenAI’s Whisper engine, so your data stays private and never leaves your device. Vibe supports many languages, multiple file formats like SRT for captions, and can transcribe from system audio, microphone, or popular websites. It runs on Mac, Windows, and Linux, and offers features like batch transcription, real-time preview, translation, and AI-powered summaries. This helps you quickly get accurate transcripts while keeping your information secure and under your control.
https://github.com/thewh1teagle/vibe