@thedevs · Post #2044 · 07.02.2023 г., 10:35
How does it know I want csv? An HTTP trick. #article#http @thedevs https://thedevs.link/37IHUE
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #851 · 2.08
Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev
Hashtags
Търсене: #http
@thedevs · Post #2044 · 07.02.2023 г., 10:35
How does it know I want csv? An HTTP trick. #article#http @thedevs https://thedevs.link/37IHUE
@thedevs · Post #1478 · 19.05.2019 г., 18:13
HTTP headers for the responsible developer. #article#tutorial#http @thedevs https://kutt.it/sCUysb
@cool_scripts · Post #1040 · 04.03.2026 г., 09:07
🔗 Sub-Store Docker & HTTP-META 更新 - 优化进程管理 现在应该不会有僵尸进程了 感谢群友 shica 的反馈 🤭Sub-Store 合集 🥰#SubStore#更新记录#changlog#updates#http-meta
@seeker_rc · Post #20068 · 09.05.2026 г., 11:55
发现了一个在线匿名聊天的地址。不过这种地址好像挺多的 http://137.175.93.226:30000/ via V2EX 分享创造 标签: #地址#http#聊天 ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。
@saintbyte_channel · Post #5 · 22.12.2024 г., 13:36
Какое чтиво нашёл: https://github.com/ByteByteGoHq/system-design-101# #web#http#grpc
@kejiqu · Post #3732 · 28.08.2025 г., 03:16
互联网新草案:网页将明确“AI 成分表”,标明 AI 参与程度 互联网工程任务组(IETF)近日发布《AI 内容披露头字段》草案,拟在网页 HTTP 响应中新增可机读的 AI 使用标记。该草案旨在为网页服务器响应添加新的 HTTP 头字段,用于标记人工智能在网页内容生成中的参与情况。该头字段将包含五个主要信息:mode(AI 使用模式)、model(使用的 AI 模型名称)、provider(模型提供方)、reviewed-by(内容审查人)及 date(生成或修改日期时间)。mode 包含四种模式:none、ai-modified、ai-originated 和 machine-generated。IETF 指出,这种标准化标记方式可为网络爬虫、内容分析工具和归档系统提供低延迟的 AI 检测途径。该草案目前尚未成为正式标准,未来可能调整。IT之家 🏷#AI#HTTP#字段#IETF 📢频道👥群组📝投稿
@djangoproject · Post #493 · 07.11.2017 г., 07:49
https://docs.python.org/3.6/library/cgi.html #cgi — Common Gateway Interface support A CGI script is invoked by an #HTTP server, usually to process user input submitted through an #HTML <FORM> or <ISINDEX> element. #server
@dejavuBlog · Post #2602 · 01.10.2025 г., 00:30
nginxconfig.io 是 DigitalOcean 维护的一个强大的 #NGINX 在线配置生成器,通过交互式界面配置 NGINX,并生成针对特定用例(如反向代理、各种应用框架 PHP/Node.js/Python、CDN、缓存等)优化的配置文件。主要功能包括支持 #HTTPS、#HTTP/2、#IPv6、certbot、HSTS、安全头、SSL 配置文件、gzip/brotli 压缩等高级配置。 开源https://github.com/digitalocean/nginxconfig.io 网站https://do.co/nginxconfig via: @dejavuBlog@dejavuGroup
@ddgksf2023 · Post #126 · 07.01.2024 г., 13:05
#Gopeed#HTTP#BitTorrent#Magnet#工具#磁力下载 👉https://github.com/GopeedLab
@GetSomeTriticumChannel · Post #28 · 08.11.2025 г., 05:50
📣Alhaitham Dashboard | HTTP API 全程控制网络节点 让代理管理更智能可玩 🖼 标签:#AlhaithamDashboard#HTTP#API#网络管理#节点监控#代理工具#iOS 📱 简介:Surge 控制器 是一个基于 Surge / Stash / Clash HTTP API 的外部控制项目,让你不仅能 查看节点状态,还能 远程修改策略与切换节点。通过接口可实时获取 连接数、流量、DNS记录、节点延迟 等运行数据,让网络管理从被动操作变为主动掌控 目前项目已支持 Surge 的连接与DNS记录查看,并推出 iOS与macOS版本(最低支持 iOS 18 / macOS 15),未来还将上线 tvOS版。它处于早期阶段,但方向明确——打造一个能“动手改”的智能网络控制平台,真正让代理可视化与自动化结合 💬 小编有话说:能一边看节点延迟一边远程切换的Surge玩家,已经不是“科学上网”,是“科学玩网”了 📱TestFlight · 💬作者 ♥@xiuerSearch 搜索历史资源 👥频道 | 👤群聊 | 👁🗨中文包
@JianjiaoPD · Post #9803 · 08.11.2025 г., 05:06
📣Alhaitham Dashboard | HTTP API 全程控制网络节点 让代理管理更智能可玩 🖼 标签:#AlhaithamDashboard#HTTP#API#网络管理#节点监控#代理工具#iOS 📱 简介:Surge 控制器 是一个基于 Surge / Stash / Clash HTTP API 的外部控制项目,让你不仅能 查看节点状态,还能 远程修改策略与切换节点。通过接口可实时获取 连接数、流量、DNS记录、节点延迟 等运行数据,让网络管理从被动操作变为主动掌控 目前项目已支持 Surge 的连接与DNS记录查看,并推出 iOS与macOS版本(最低支持 iOS 18 / macOS 15),未来还将上线 tvOS版。它处于早期阶段,但方向明确——打造一个能“动手改”的智能网络控制平台,真正让代理可视化与自动化结合 💬 小编有话说:能一边看节点延迟一边远程切换的Surge玩家,已经不是“科学上网”,是“科学玩网”了 📱TestFlight · 💬作者 ♥@xiuerSearch 搜索历史资源 👥频道 | 👤群聊 | 👁🗨中文包
@djangoproject · Post #459 · 04.10.2017 г., 04:08
https://www.fullstackpython.com/websockets.html A #WebSocket is a standard protocol for two-way data transfer between a #client and #server. The WebSockets protocol does not run over #HTTP, instead it is a separate implementation on top of #TCP. #AJAX