TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 5 подобни публикации

Търсене: #linuxdo

当前筛选 #linuxdo清除筛选
QIN2DIM's Tech Channel

@qin2dim · Post #2295 · 28.03.2026 г., 07:17

Claude Subscription 全球汇率套利链分析 | 文献综述 💡Linuxdo/@0xkk - Anthropic Claude 注册及支付的阶段性实验结论 💡Linuxdo/@dwqxq1 最近Claude Code Max,Codex Team难民激增,最新渠道研究 💡Linuxdo/@xiaomao 取之于佬用之于佬,提供一套可能防封的claude实践 💡Linuxdo/@dwqxq1 Claude Code Max,Opus-4.6的所有渠道研究 💡Linuxdo/@dwqxq1 一系列支付渠道调研文章链接 ✏️GitHub - CLIProxyAPI ✏️GitHub - Wei-Shaw/sub2api 🍺oyunfor 土耳其里拉 🍺 Find Cheap Subs - Claude by Anthropic 各国订阅价格 #claude#linuxdo

折腾实验室频道

@TossLabChannel · Post #672 · 12.05.2025 г., 15:12

#LinuxDo#浏览器脚本#论坛增强 LinuxDo Scripts:为 LinuxDo 论坛量身打造的增强脚本合集 由 dlzmoe 开发的 LinuxDo Scripts 是一套专为 LinuxDo 社区打造的浏览器增强脚本,涵盖浏览体验优化、互动增强、内容管理与 AI 智能辅助等多维度功能。 支持话题预览、快捷回复、“只看楼主”、黑夜模式、中英文混排优化等,同时内置 AI 总结与自动回帖等实用能力,并允许自定义皮肤与样式。 适用于提升重度用户的浏览效率与论坛参与体验。 🔘@TossLab🔘@TossLabChannel 🔘折腾系列频道 - 全面介绍 🔘境外离岸银行教程合集目录 🔘折腾实验室优质Github项目合集 🔘大流量卡三大运营商推荐合作店

折腾实验室频道

@TossLabChannel · Post #73 · 31.10.2024 г., 06:33

#脚本猫#ScriptCat#linuxdo #大麦抢票脚本猫油猴插件 全自动抢票,自动提交订单 本脚本后续不会更新 如果你抢周杰伦或者其他演唱会时出现 该渠道不支持购买 那么是正常的 因为网页端抢票被官方ban了 无法解决 抢票之前务必在APP内填写好收货地址和观影人信息!! 抢不到是正常现象 拼的是网速 😀教程地址:点击链接 😀脚本猫地址:点击链接 📢 群聊:@TossQL 🎈 频道:@TossQLChannel

折腾实验室频道

@TossLabChannel · Post #472 · 02.01.2025 г., 10:54

#linuxdo#GitHubActions#签到 LinuxDo 每日签到项目 这个项目用于自动登录 LinuxDo 网站并每日签到,同时随机浏览帖子。它利用 Python 和 Playwright 自动化库实现浏览器的模拟操作,并支持 PushPlus 推送功能。 功能: - 自动登录并签到 LinuxDo。 - 浏览随机帖子。 - 在 GitHub Actions 中自动运行。 这个项目简化了 LinuxDo 的每日签到流程,适合需要自动化操作的用户。 其他方式: 脚本猫: 点击查看 📢 群聊: @TossLab 🎈 频道: @TossLabChannel ❤️不想错过精彩内容,请打开 #频道通知,你的 #阅读#点赞#转发 便是我发帖的最大动力!

✈️LDStatusPro | Linuxdo & IDCFlare 社区增强脚本,将等级进度、浏览贴文做成可视化仪表盘 🏷 检索标签:#LDStatusPro#LinuxDo#IDCFlare#油猴#脚本#插件 ⭐️ 详情介绍:LDStatusPro 是给 Linuxdo 与 IDCFlare 用的社区增强脚本,把一堆分散功能收进同一个面板里,方便让你在刷帖过程中 随时掌握信任等级进度与阅读状态,特别适合想稳步升级、又希望把论坛使用变成可量化习惯的人 一套面板把信任等级、阅读统计、云同步和吃瓜总结都塞进同一个侧栏,同时支持 跨浏览器跨设备云同步与历史恢复,再加上 AI 帖子总结与追问,看热点和补课都省时间 🔎官网 · 🧰油猴脚本 · 📖GitHub 😌频道 |🙂群聊 |😋中文包 |☺️搜索