@yoona_moods · Post #149 · 05.04.2023 г., 16:11
果然免费的才是最贵的😑 甚至没有邮件通知下就续期清零了 #E5
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #851 · 2.08
Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev
Hashtags
Търсене: #e5
@yoona_moods · Post #149 · 05.04.2023 г., 16:11
果然免费的才是最贵的😑 甚至没有邮件通知下就续期清零了 #E5
Hashtags
@seeker_rc · Post #20387 · 13.05.2026 г., 00:25
[送码]我开发了一个同声传译工具“秒译”支持十几种主流语言,支持 IOS 和 MAC 端 大家好,我刚上架了一个同声传译工具:秒译。适用于 iOS 和 MAC App Store: <https://apps.apple.com/cn/app/%E7%A7%92%E8%AF%91-%E5%90%8C%E5%A3%B0%E4%BC%A0%E8%AF%91-%E5%AE%9E%E6%97%B6%E8%BD%AC%E5%BD%95-%E6%9C%AC%E5%9C%B0%E7%A6%BB%E7%BA%BF-%E6%95%B0%E6%8D%AE%E5%AE%89%E5%85%A8/id6764510070> 它是一个纯本地进行转录+翻译的软件,无需联网也可以使用。速度和准确性都还不错满足... via V2EX 分享创造 标签: #E5#E6#E7 ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。
@seeker_rc · Post #20095 · 09.05.2026 г., 15:55
[自荐] CapsWriter-Offline v2.5 好用的 PC 端的语音输入工具,高准确率、低延迟,支持热词、LLM 后处理 按住 CapsLock 或 鼠标 X2 说话,松开就上屏。就这么简单。 CapsWriter-Offline 是一个专为 Windows 打造的完全离线 语音输入工具。 ✏✨ 核心特性 ⦁ 语音输入 :按住 CapsLock 键 或 鼠标侧键 X2 说话,松开即输入,超低延迟,默认去除末尾逗句号。支持对讲机模式和单击录音模式。 ⦁ 文件转录 :音视频文件往客户端 exe 一丢,字幕 (.srt)、文本 (.txt)... via V2EX 分享创造 标签: #E5#E8#BD ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。
@seeker_rc · Post #19783 · 06.05.2026 г., 09:55
随心趣弹上架 App Store 了,送 50 个激活码 📚 给我儿子做来玩的,终于过审了。 IOS ··· 📚 激活码 786AXNW43NK7TFPWHR PWL3R8H3YMLXNYL88K ELWLYWYNL8R87F73EA TEWW86WKTTTHMLTWEX LFMHWJP6YKWKY6XWKM LFJENFJW8HKHFRP7JJ 67XNLHWLF88E4MMJF6 EW7TJ4A6EAM3F3NAPN M7WPX... via V2EX 分享创造 标签: #激活码#E5#趣弹 ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。