TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #350 · 20.05

Если верить открытым источникам, рынок электросамокатов в России главным образом держат Whoosh и Urent (хотя сейчас ещё Яндекс вклинивается, и с его ресурсами это вполне возможно). При этом у Urent больше городов и больше самокатов, чем у Whoosh, но ниже доходы. Я подумал: наверняка бизнес-аналитики Urent днями и ночами сидят и ломают голову, что бы им поменять и улучшить, чтобы начать выигрывать эту конкуренцию. Строят теории, проводят тесты. Сложная работа, в общем, бизнес и рынок не такие предсказуемые вещи. А потом я воспользовался Urent и за 5 минут нашел столько косяков UI/UX в приложении, что мне стало всё понятно. Кроме того, почему Urent ничего с этими косяками не делает. 1. Сканирование кода в Whoosh приводит к появлению полноэкранной модалки с большими кнопками и основной информацией о самокате и стоимости. Сканирование кода в Urent выдает в самом низу экрана блок кнопок, в которые не только очень сложно попасть, но его ещё и надо скроллить (см. левый скриншот). При этом весь экран занят уже не нужной к этому моменту камерой. Такой интерфейс заточен под перебор самокатов, но на деле человеку на улице на ходу нужно просто максимально быстро взять первый самокат, к которому он подошёл. 2. О том, что страховка включена и будет стоить дополнительных денег, можно догадаться только за счёт знания об этой функции из других сервисов. Да, Whoosh, конечно, поступает очень по-мудачески, постоянно автоматически включая платную страховку, из-за чего её надо выключать вручную каждый раз при каждом заказе. Но в Urent необходимость этого действия ещё и довольно неочевидна (а страховка тоже, конечно же, по-умолчанию всегда включена). 3. Я отсканировал самокат, затем нажал подтверждение заказа. Система после этого написала мне, что данный самокат недоступен. Неужели, нельзя об этом писать ещё на этапе сканирования? Зачем выводить кнопку заказа для недоступного самоката? 4. Кнопка перехода к текущей геопозиции перекрыта неубирающейся шторкой снизу (см. правый скриншот). И это только вещи, которые прям за первые 5 минут выявляются и очень на поверхности. А исправить их может один программист и один дизайнер за пару недель. Удивительно, как некоторые бизнесы не хотят зарабатывать. #dev

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #speechrecognition

当前筛选 #speechrecognition清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8484 · 09.09.2025 г., 12:01

🎙️ Qwen3-ASR — универсальная модель распознавания речи! 🟢Поддержка EN/CN + ещё 9 языков: ar, de, en, es, fr, it, ja, ko, pt, ru, zh 🟢 Авто-определение языка 🟢 Модель умеет распознавать речь даже в сложных условиях — когда человек поёт, читает рэп или говорит под фоновую музыку. — WER <8% (ошибки меньше 8 слов на каждые 100) 🟢 Работает даже в шуме, низком качестве и на расстоянии 🟢 В модель можно добавить свои слова/термины/имена и фразы, и она будет их правильно распознавать ▪API:https://bailian.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2979031 ▪ModelScope Demo: https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo ▪Hugging Face Demo: https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo ▪Blog:https://qwen.ai/blog?id=41e4c0f6175f9b004a03a07e42343eaaf48329e7&from=research.latest-advancements-list @ai_machinelearning_big_data #ASR#SpeechRecognition#Qwen3#AI#MachineLearning#DeepLearning#VoiceAI

Machinelearning

@ai_machinelearning_big_data · Post #8296 · 18.08.2025 г., 11:11

🎙️NVIDIA выпустили Canary-1B v2 — открытую модель для распознавания и перевода речи, которая работает с 25 европейскими языками. Что она умеет: - 📝 Точное ASR (распознавание речи) и AST (перевод речи) между английским и 24 другими языками. - Автоматическая пунктуация, капитализация и точные таймстампы до слова. - Поддержка русского, французского, немецкого, испанского и многих других языков. Чем интересна - До 10× быстрее инференс, чем у моделей в 3 раза больше. - Уже показывает state-of-the-art точность среди открытых моделей на Hugging Face. - Лицензия CC-BY-4.0 — можно свободно использовать в проектах. Под капотом: - Архитектура: FastConformer-энкодер + Transformer-декодер (~978M параметров). - Форматы: .wav и .flac, моно 16 кГц. - Легко интегрируется через NVIDIA NeMo или прямо с Hugging Face. Где пригодится: 🟢 голосовые ассистенты 🟢 субтитры и перевод видео 🟢 чат-боты с речевым вводом 🟢 real-time анализ речи Всего ~978M параметров → легче, быстрее и дешевле в использовании, чем большие модели конкурентов. 🟠Попробовать можно здесь: https://huggingface.co/nvidia/canary-1b-v2 🟠SET: https://huggingface.co/datasets/nvidia/Granary 🟠PARAKEET: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v3 @ai_machinelearning_big_data #AI#NVIDIA#SpeechRecognition#ASR#AST#Multilingual#MachineLearning#DeepLearning