TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 23 подобни публикации

Търсене: #http

当前筛选 #http清除筛选
探索号

@seeker_rc · Post #20068 · 09.05.2026 г., 11:55

发现了一个在线匿名聊天的地址。不过这种地址好像挺多的 http://137.175.93.226:30000/ via V2EX 分享创造 标签: #地址#http#聊天 ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。

科技&趣闻&杂记

@kejiqu · Post #3732 · 28.08.2025 г., 03:16

互联网新草案:网页将明确“AI 成分表”,标明 AI 参与程度 互联网工程任务组(IETF)近日发布《AI 内容披露头字段》草案,拟在网页 HTTP 响应中新增可机读的 AI 使用标记。该草案旨在为网页服务器响应添加新的 HTTP 头字段,用于标记人工智能在网页内容生成中的参与情况。该头字段将包含五个主要信息:mode(AI 使用模式)、model(使用的 AI 模型名称)、provider(模型提供方)、reviewed-by(内容审查人)及 date(生成或修改日期时间)。mode 包含四种模式:none、ai-modified、ai-originated 和 machine-generated。IETF 指出,这种标准化标记方式可为网络爬虫、内容分析工具和归档系统提供低延迟的 AI 检测途径。该草案目前尚未成为正式标准,未来可能调整。IT之家 🏷#AI#HTTP#字段#IETF 📢频道👥群组📝投稿

Dejavu's Blog

@dejavuBlog · Post #2602 · 01.10.2025 г., 00:30

nginxconfig.io 是 DigitalOcean 维护的一个强大的 #NGINX 在线配置生成器,通过交互式界面配置 NGINX,并生成针对特定用例(如反向代理、各种应用框架 PHP/Node.js/Python、CDN、缓存等)优化的配置文件。主要功能包括支持 #HTTPS、#HTTP/2、#IPv6、certbot、HSTS、安全头、SSL 配置文件、gzip/brotli 压缩等高级配置。 开源https://github.com/digitalocean/nginxconfig.io 网站https://do.co/nginxconfig via: @dejavuBlog@dejavuGroup

🌾 整点小麦:iOS/macOS App

@GetSomeTriticumChannel · Post #28 · 08.11.2025 г., 05:50

📣Alhaitham Dashboard | HTTP API 全程控制网络节点 让代理管理更智能可玩 🖼 标签:#AlhaithamDashboard#HTTP#API#网络管理#节点监控#代理工具#iOS 📱 简介:Surge 控制器 是一个基于 Surge / Stash / Clash HTTP API 的外部控制项目,让你不仅能 查看节点状态,还能 远程修改策略与切换节点。通过接口可实时获取 连接数、流量、DNS记录、节点延迟 等运行数据,让网络管理从被动操作变为主动掌控 目前项目已支持 Surge 的连接与DNS记录查看,并推出 iOS与macOS版本(最低支持 iOS 18 / macOS 15),未来还将上线 tvOS版。它处于早期阶段,但方向明确——打造一个能“动手改”的智能网络控制平台,真正让代理可视化与自动化结合 💬 小编有话说:能一边看节点延迟一边远程切换的Surge玩家,已经不是“科学上网”,是“科学玩网”了 📱TestFlight · 💬作者 ♥@xiuerSearch 搜索历史资源 👥频道 | 👤群聊 | 👁‍🗨中文包

📣Alhaitham Dashboard | HTTP API 全程控制网络节点 让代理管理更智能可玩 🖼 标签:#AlhaithamDashboard#HTTP#API#网络管理#节点监控#代理工具#iOS 📱 简介:Surge 控制器 是一个基于 Surge / Stash / Clash HTTP API 的外部控制项目,让你不仅能 查看节点状态,还能 远程修改策略与切换节点。通过接口可实时获取 连接数、流量、DNS记录、节点延迟 等运行数据,让网络管理从被动操作变为主动掌控 目前项目已支持 Surge 的连接与DNS记录查看,并推出 iOS与macOS版本(最低支持 iOS 18 / macOS 15),未来还将上线 tvOS版。它处于早期阶段,但方向明确——打造一个能“动手改”的智能网络控制平台,真正让代理可视化与自动化结合 💬 小编有话说:能一边看节点延迟一边远程切换的Surge玩家,已经不是“科学上网”,是“科学玩网”了 📱TestFlight · 💬作者 ♥@xiuerSearch 搜索历史资源 👥频道 | 👤群聊 | 👁‍🗨中文包

12
ПредишнаСтр. 1 от 2Следваща