TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #482 · 2.08

Я участвую в конкурсе разработчиков «Код Петербурга», проводимом совместно VK и городом. По условиям нужно сделать или VK-приложение или чат-бота для VK/Маруси с какой-то важной для жителя или гостя города функцией, и с использованием одного из предоставленных внешних API. Я попробовал воплотить свои давние мысли по семантическому поиску по текстам, в чем мне помог @wooferclaw. Что-то подобное мы пытались соорудить на хакатоне в Салехарде, но сейчас я пошёл дальше. Бот для Маруси, который ищет мероприятия в Петербурге с сайта KudaGo. При этом к боту подключён морфологический словарь и тезаурус, который умеет определять домены и ассоциативные связи между словами. Работает вроде неплохо. Во-первых, довольно точно ищет по прямым связям. Например, хорошо понимает, что слова «научный» и «наука» одинаковые, хотя в словаре словоформ они разные. Во-вторых, умеет находить связи по области: допустим, если попросить что-то про пришельцев, предлагает экспозицию о внеземных цивилизациях, хотя ни в описании, ни в ключевых словах этой экспозиции нет слова «пришелец» однокоренных с ним. Но этот поиск приводит и к забавным последствиям, которые лично я не считаю недостатком, а скорее щепоткой соли в работе алгоритма. Так, при запросе о пришельцах может выдать выставку о коммунальных квартирах (что действительно близко по смыслу, но человеку, который ищет пришельцев, скорее всего нужно не это). А ещё на слово «крокодилы» предлагает экскурсию по рекам и каналам, мне очень нравится :) Потестить можно, открыв Марусю (в приложении ВК или в отдельном) и сказав «Запусти навык Куда Пойти в Петербурге». А результаты конкурса будут в октябре. Там ещё второй этап, на него тоже что-нибудь подам. #dev

Hashtags

Резултати

Намерени 45 подобни публикации

Търсене: #stt

当前筛选 #stt清除筛选
Ali Ahmad

@AlisherAhmatovich · Post #1189 · 09.01.2025 г., 16:15

O'zbekcha STT (Speech-to-Text) uchun benchmarking v1 tayyor! O'zbek tilida nutqni matnga aylantirish bo'yicha dastlabki etalon tizimni yaratdik! Ushbu jarayonda: ✅ Adabiy O'zbek tili ✅ Turli hududiy shevalar ✅ Musiqalar va suhbatlar ✅ Shovqinli audiolar bilan o’zimizni va bozordagi mavjud modellarni sinab ko'rdik. Tez orada natijalarni va benchmarkni e’lon qilamiz, hamda benchmarkni doimiy yangilab borish niyatimiz bor. Benchmark mezonlari: - WER (Word Error Rate) - So’zlar xatolik darajasi. - CER (Character Error Rate) – Harflar xatolik darajasi. Bu nafaqat texnologik rivojlanish, balki O'zbek tilining raqamli muhitda mustahkam o'rin egallashi yo'lida muhim qadamdir. Maqsadimiz – O'zbekcha STT modellarining aniq va sifatli ishlashini ta'minlashdir. Kelajak rejalari: - Test natijalarini batafsil tahlil qilib, modellarni yanada takomillashtirish. O'zbek tili texnologiyalari rivoji uchun birgalikda ishlashda davom etamiz! STT modelimizni @aishaovozbot’da yoki aisha.group’da sinab ko’rishingiz mumkin. #aisha#stt @elzodxon

Hashtags

ПредишнаСтр. 1 от 4Следваща