TGTGInsighttelegram intelligenceLIVE / telegram public index
← () => "翠楼屋"

TGINSIGHT SIMILAR POSTS

查找相似内容

Source channel @lambdaexpression · Post #206 · 4月20日

前段时间一直被MajdataPlay的外键输入问题困扰:有玩家反映majplay会无征兆地出现拖判和吃音,但是内屏一切正常 因为我是第一次接触游戏开发,IO这方面也完全没经验 一开始我和bb本怀疑是线程调度的问题,即:IO线程时间片被其他线程挤占了,导致IO线程无法及时处理HID设备回报。为了验证这个猜想,我们尝试提高了IO线程的优先级,照旧 接下来我怀疑是我那套框架有问题:majplay是根据上一帧与这一帧的按键状态判断按键是不是"click"。为此我重写了这部分的实现,改进了IO线程与主线程之间的交互,问题照旧....... 到这里我已经怀疑这不是majplay的锅:IO线程没有任何异常,IO线程与主线程的交互没有问题,Note判定逻辑也没有问题,那就是设备确实没有回报给majplay或者设备发过来的回报中按键确实没有按下,但是大佬说hdd没有这种问题.....(人已经快崩溃了,这完全看不透也摸不着,因为我用单片机模拟玩家打高速纵连是完全没有问题的,我在家里用手台测试也没有问题) 到最后,bb本灵光一闪,说有没有可能是led刷新率过高,把按键控制板干爆炸了?我们让大佬把led刷新间隔从16ms改成100ms,吃音问题瞬间没有了,无语了 。。。。。。。。。。。。。。。。。。。。 adx是一个控制板同时管理按键和led,为什么我没有遇到吃音问题呢,因为我的手台不是adx的... #dev

Hashtags

Results

找到 21 条相似帖子

搜索 #asr

当前筛选 #asr清除筛选
Pro Analysis

@proanalysistrader · Post #28059 · 2024/10/23 17:39

#ASR/USDT analysis : #ASR is in a downtrend, making lower lows (LLs) and lower highs (LHs) below the 200 EMA. The price has broken down and retested the support zone, which is now acting as resistance. It is expected to continue its bearish momentum and test lower levels. Wait for a pullback for a short entry. TF : 30min Entry : $2.090 Target : $2.015 SL : $2.136

Hashtags

Crypto Profit Coach™

@cryptoprofitcoach · Post #8568 · 2022/12/07 17:01

#ASR👈 https://www.binance.com/en/trade/ASR_BTC Buying Zone 1570- 1600 👆 Highly pumpable Coin Buy in parts 👈strictly follow for max profits Sell 🤑 1700 🤑 1700-1860 🤑 1860-2000 🚀 2000- 2200 & above Bullish above 1500

Hashtags

Crypto Profit Coach™

@cryptoprofitcoach · Post #8446 · 2022/11/11 10:43

#ASR👈 https://www.binance.com/en/trade/ASR_BTC Buying Zone 1360- 1400 👆 Highly pumpable Coin Buy in parts 👈strictly follow for max profits Sell 🤑 1470-1540 🤑 1540-1600 🤑 1600-1700 🚀 1700- 1800 & above Exit/Re-Entry -1320

Hashtags

Crypto

@signal_bitcoins · Post #1977 · 2023/12/23 15:21

#ASR compressed between the trendline and support zone on Weekly time frame, breakout incoming..🚀 ❄️@signals_bitcoin_crypto❄️ ❄️@Shadow_support0o❄️

Hashtags

Machinelearning

@ai_machinelearning_big_data · Post #8401 · 2025/08/29 09:04

⚡️OLMoASR: открытые ASR-модели от AI2. Институт искусственного интеллекта Аллена выпустил OLMoASR, семейство из 6 моделей для автоматического распознавания английской речи. ▶️Линейка моделей: 🟢OLMoASR-tiny.en (39M); 🟢OLMoASR-base.en (74M); 🟢OLMoASR-small.en (244M); 🟢OLMoASR-medium.en (769M); 🟠OLMoASR-large.en-v1 (1.5B) обученная на 440 тыс. часов аудио; 🟠OLMoASR-large.en-v2 (1.5B) обученная на 680 тыс. часов аудио; По результатам тестов на 21 датасете, модели OLMoASR показали производительность, сопоставимую с Whisper от OpenAI, а в некоторых случаях и превзошли ее, особенно при работе с длинными аудиозаписями. Проект полностью открытый: опубликованы не только веса моделей, но и датасет, код для обработки данных, а также скрипты для обучения и оценки. Все компоненты, включая код и данные, доступны на GitHub и Hugging Face. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей 🟡Техотчет 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#ASR#OLMoASR#AI2

🗣 VibeVoice ASR ● Распознавание речи и диаризация ● RU ● Portable by Nerual Dreming Ссылка на оригинальный GitHub:https://github.com/microsoft/VibeVoice Ссылка на репозиторий репакера:https://github.com/timoncool/VibeVoice_ASR_portable_ru Репакер:#nerual_dreming Дата обновления: 3 февраля 2026 Категории:#stt, #ASR, #diarization, #AIaudio Платформа:#Windows Язык: RU Системные требования: NVIDIA GPU с поддержкой CUDA от 8 ГБ VRAM для полной версии, меньше для квантованной Совместимость:#Nvidia 🖥Описание софта VibeVoice ASR — новейшая модель от Microsoft для транскрибации, диаризации (разделения по спикерам) и простановки таймкодов за один проход. Главная фишка — обработка до 60 минут аудио целиком, без нарезки на куски, что позволяет модели «понимать» контекст всей беседы. Особенности портативной версии: В сборку включены две модели: полная (оригинал) и квантованная (от scerz). Реализована поддержка эмуляции 4-bit квантизации для полной модели — это позволяет запускать тяжелую оригинальную версию даже на картах с небольшим объемом памяти без потери качества. Также добавлена нативная поддержка видеофайлов и парсер текста с выбором спикеров для показа. 😬Основные возможности VibeVoice ASR: 🟣Две модели на борту: Выбор между оригинальной Full версией и оптимизированной Quantized (scerz). 🟣Эмуляция квантизации: Уникальная фича сборки — возможность запуска полной модели в режиме 4-bit (bitsandbytes) для экономии VRAM. 🟣Всеядность: Поддержка не только аудио, но и видео (MP4, MKV, AVI, MOV) — звук извлекается автоматически через FFmpeg. 🟣Умная диаризация: Точное определение «Кто, Когда и Что сказал» (Who, When, What). 🟣Длинный контекст: Обработка часовых записей без потери смысла и путаницы в спикерах. 🟣Удобство: Веб-интерфейс на русском языке 🟣Парсер текста: позволяет скрыть или показать временные метки, спикеров, дескрипторы 💿Установка и запуск ⁍ Скачайте архив с установщиком или окружением. ⁍ Распакуйте в папку без кириллицы в пути. ⁍ Запустите install.bat для установки библиотек (для установщика). ⁍ Запустите run.bat для старта веб-интерфейса. ⁍ Модели скачаются при первом запуске ➡️Скачать VibeVoice ASR Portable installer— установщик, сам все скачает ➡️Скачать VibeVoice ASR Portable env — готовое окружение для RTX 4090 и win11 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее

Machinelearning

@ai_machinelearning_big_data · Post #8567 · 2025/09/17 10:10

⚡️Qwen-ASR Toolkit — мощный Python CLI для быстрой транскрипции длинных аудио и видео Эта утилита снимает ограничение API Qwen-ASR (бывший Qwen3-ASR-Flash) в 3 минуты и позволяет расшифровывать часы контента. Достигается это за счёт умного разбиения записи и параллельной обработки. Основные возможности: - Снятие лимита в 3 минуты - транскрибируй файлы любой длины - Умное разбиение (VAD - это технология, которая определяет, где в аудио есть речь, а где — пауза или шум.) - деление по естественным паузам, без - Высокая скорость - многопоточность и параллельные запросы к API - Автоматический ресемплинг — конвертация в нужный формат 16kHz mono - Поддержка любых форматов — MP4, MOV, MKV, MP3, WAV, M4A и др. - Простота - запуск одной командой через CLI 🟢Установка: pip install qwen3-asr-toolkit 🔗 GitHub: https://github.com/QwenLM/Qwen3-ASR-Toolkit @ai_machinelearning_big_data #asr#speech2text#qwen#opensource#nlp#toolki

Data Science Jobs

@datasciencejobs · Post #3041 · 2025/11/22 15:01

#вакансия#machinelearning#ml#datascience#ds#python#middle#senior#nlp#asr#tts Middle/Senior Machine Learning Engineer Вилка: 3000–5500 евро (в зависимости от уровня) 📍Локации: Россия, СНГ, ЕС, Сербия, Турция Компания: североамериканская компания, работающая на рынке VoIP-решений Стек: Python, ML&DL, NLP, ASR, Speech synthesis (TTS), PyTorch/TensorFlow, HuggingFace, ONNX/TensorRT, NeMo, NumPy Что предстоит делать: — Разрабатывать решения в области речевых технологий — обработка аудио и речи (в оффлайн и потоковом режиме), анализ текста (суммаризация, поиск сущностей, классификация, выделение тем и т.д.), детектирование угроз (мошенничество, спам и т.д.). — Быстро создавать прототипы решений и подстраивать их под бизнес-требования. — Разрабатывать и оптимизировать ML-модели для распознавания речи, анализа текста и смежных задач. — Взаимодействовать с проектным менеджером и продакт-лидом для преобразования бизнес-требований в технические решения. — Следить за современными методами и исследованиями в области обработки речи и NLP. — Участвовать в профессиональном развитии команды. Будет существенным плюсом: — Опыт работы с современными библиотеками обработки речи. — Опыт конвертации/оптимизации/ускорения моделей с помощью TensorRT или аналогичных инструментов. — Участие в ML-соревнованиях (Kaggle и др.). Требования к английскому: уровень B1 и выше. Позиция подразумевает участие во всех этапах разработки — от уточнения бизнес-требований до реализации продакшн-решений. Контакт для связи: @sl_sergei

FrolovLib

@frolov_lib · Post #314 · 2026/02/04 10:23

Моя новая статья на Хабре про распознавание речи https://habr.com/ru/companies/first/articles/992508/ #asr #распознавание_речи #потоковое_распознавание #преобразование_речи_в_текст #AI_технологии #голосовое_управление

FrolovLib

@frolov_lib · Post #309 · 2026/01/25 08:57

Моя новая статья про распознавание речи в реальном времени на микрокомпьютере отечественной сборки Репка 4. Скоро она выйдет и на Хабре #asr #распознавание_речи #потоковое_распознавание #преобразование_речи_в_текст #AI_технологии #голосовое_управление https://repka-pi.ru/blog/post/161

FrolovLib

@frolov_lib · Post #308 · 2026/01/24 06:21

Голосовое управление светодиодом через реле на Repka-Pi #asr #распознавание_речи #потоковое_распознавание #преобразование_речи_в_текст #AI_технологии #голосовое_управление

FrolovLib

@frolov_lib · Post #302 · 2026/01/22 11:28

Встречайте мою новую статью! Хабр Как прикрутить нейросеть к SDR: распознавание речи в GNU Radio https://habr.com/p/987784/ #asr #распознавание_речи #потоковое_распознавание #преобразование_речи_в_текст #AI_технологии #голосовое_управление

12
上一页第 1/2 页下一页