TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 16 подобни публикации

Търсене: #np

当前筛选 #np清除筛选
Ганиев (Ganiev) 🦑

@mirzashakhrukhtw · Post #30 · 15.08.2019 г., 05:48

Катались с отцом по вечерней Бухаре. Ветер и прохлада сквозь открытые окна в салоне. Молча двигаем головы в такт. #np Tyga, G-Eazy, Rich The Kid - Girls have fun

Hashtags

#np#和平精英#硬件断点#子追 追踪版本 公测 内置驱动 无过检测 经测试稳定 游戏现在没有断点检测 仅供参考 拉闸自负 3月22日更新 修复部分情况下出现卡死的问题 追踪部位新增脖子和上半身(即头部 脖子 左右肩) 优化追踪落点 落点随机偏移 避免高风险 修复配置不能正常保存的BUG

中文名: 女仆咖啡厅 话数: 12 放送开始: 2010年10月7日 放送星期: 星期四 原作: 石黒正数(少年画報社、月刊『ヤングキングアワーズ』連載) 脚本: 高山カツヒコ、大嶋実句 ☺️评分:7.7 力荐 🟢故事简介 女高中生岚山步鸟,在丸子商店街的咖啡厅SEASIDE的做兼职服务生。有一天,店长宣告为了咖啡厅的繁盛要构想新策略。于是,最终敲定把咖啡厅改造成时下流行的女仆咖啡厅。但是,店里的相关人员没人了解女仆咖啡厅,最后就只让服务员换上女仆装就宣布重新开业了。步鸟学校的前辈双叶、单恋步鸟的同级生广章,围绕在步鸟身边发生的各种闹剧就此展开…… 🌐OneDrive:点击下载 🗂百度网盘:点击下载 📁往期番剧汇总表格:打开 🔐解压:blackcatunderthemoon 引索:#N#NP 标签:#漫改#搞笑#日常#女仆

#np#和平精英#内核#rt驱动#qx驱动#pd驱动#twt驱动#解密 仿雪花方框/载具/血条机制 小地图雷达 瞄准区域简化 自定义物资、字体、绘制样式 默认就很顶 各种自定义充分满足你的癖好 支持各种驱动 2月16日更新 对接ditpro_ko驱动1.0.0版本 对接ditpro_kpm驱动1.0.4版本 对接distortion_kpm驱动最新版本 优化全局水印显示 添加了观透 禁用观透时距离过滤机制 修改背敌机制关于人机的变色 人机固定显示为半透明灰色 修复了多次点击初始化不能重新获取数据的BUG 添加中央背敌放缩 添加中央背敌距离显示开关 修复简化配置不能保存的BUG 优化简化配置保存机制 简化配置保存到 NPKernel1.cfg 修复部分配置不能保存的BUG 修改最高帧率至240帧 添加视角雷达 添加雷达人物朝向(人物掐雷时 人物朝向变红) 人机雷达点改为固定灰色半透明 免费卡密 Channel@NPZPD

12
ПредишнаСтр. 1 от 2Следваща