@cheap_proxy_priceimg · Post #115 · 28.06.2025 г., 03:33
#stt
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #367 · 30.05
Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev
Hashtags
Търсене: #stt
@cheap_proxy_priceimg · Post #115 · 28.06.2025 г., 03:33
#stt
Hashtags
@Speedtest_Sy · Post #648 · 25.02.2022 г., 15:10
#STT#V2Ray 测速环境:山西电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️价格预览▫️测速频道▫️
@Speedtest_Sy · Post #484 · 15.01.2022 г., 14:29
#STT#V2Ray 测速环境:山西电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️价格预览▫️测速频道▫️
@Speedtest_Sy · Post #444 · 17.12.2021 г., 14:25
#STT#V2Ray 测速环境:山西电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️价格预览▫️测速频道▫️
@Speedtest_Sy · Post #417 · 03.12.2021 г., 05:35
#STT#V2Ray 测速环境:山西电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️价格预览▫️测速频道▫️
@Speedtest_Sy · Post #265 · 30.09.2021 г., 13:13
#STT#V2Ray 测速环境:山西电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️价格预览▫️测速频道▫️
@Speedtest_Sy · Post #198 · 08.09.2021 г., 02:35
#STT#V2Ray 测速环境:山西电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️价格预览▫️测速频道▫️
@Speedtest_Sy · Post #76 · 07.08.2021 г., 18:20
#STT#V2Ray 测速环境:山西电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️价格预览▫️测速频道▫️
@AlisherAhmatovich · Post #1189 · 09.01.2025 г., 16:15
O'zbekcha STT (Speech-to-Text) uchun benchmarking v1 tayyor! O'zbek tilida nutqni matnga aylantirish bo'yicha dastlabki etalon tizimni yaratdik! Ushbu jarayonda: ✅ Adabiy O'zbek tili ✅ Turli hududiy shevalar ✅ Musiqalar va suhbatlar ✅ Shovqinli audiolar bilan o’zimizni va bozordagi mavjud modellarni sinab ko'rdik. Tez orada natijalarni va benchmarkni e’lon qilamiz, hamda benchmarkni doimiy yangilab borish niyatimiz bor. Benchmark mezonlari: - WER (Word Error Rate) - So’zlar xatolik darajasi. - CER (Character Error Rate) – Harflar xatolik darajasi. Bu nafaqat texnologik rivojlanish, balki O'zbek tilining raqamli muhitda mustahkam o'rin egallashi yo'lida muhim qadamdir. Maqsadimiz – O'zbekcha STT modellarining aniq va sifatli ishlashini ta'minlashdir. Kelajak rejalari: - Test natijalarini batafsil tahlil qilib, modellarni yanada takomillashtirish. O'zbek tili texnologiyalari rivoji uchun birgalikda ishlashda davom etamiz! STT modelimizni @aishaovozbot’da yoki aisha.group’da sinab ko’rishingiz mumkin. #aisha#stt @elzodxon
@Speedtest_Sy · Post #792 · 12.04.2022 г., 12:33
#STT#V2Ray#IPLC 测速环境:广东电信300兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️测速投稿▫️测速频道▫️
@Speedtest_Sy · Post #776 · 11.04.2022 г., 14:00
#STT#V2Ray#IPLC 测速环境:广东电信300兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️测速投稿▫️测速频道▫️
@Speedtest_Sy · Post #757 · 08.04.2022 г., 04:26
#STT#V2Ray#IPLC 测速环境:重庆电信500兆 账号注册:https://sttlink.com/auth/register?code=wMOM ▫️测速投稿▫️测速频道▫️