@PTPPAction · Post #1677 · 20.03.2024 г., 14:40
#dev#ronggang#merged feat: 下载历史增加批量重新下载及过滤功能;
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #851 · 2.08
Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev
Hashtags
Общо глобално търсене
@PTPPAction · Post #1677 · 20.03.2024 г., 14:40
#dev#ronggang#merged feat: 下载历史增加批量重新下载及过滤功能;
@PTPPAction · Post #1289 · 08.11.2023 г., 14:25
#dev#ronggang#merged Merge branch 'dev' of github.com:pt-plugins/PT-Plugin-Plus into dev
@PTPPAction · Post #1277 · 03.11.2023 г., 11:20
#dev#ronggang#merged Merge branch 'dev' of github.com:pt-plugins/PT-Plugin-Plus into dev
@PTPPAction · Post #2564 · 21.01.2025 г., 12:18
#dev#ShayLu#merged 推荐下载 update ubits level seedingPoints commit update ubits level seedingPoints
@PTPPAction · Post #2551 · 14.01.2025 г., 03:12
#dev#quzard#merged 推荐下载 fix count is not defined commit fix count is not defined
@PTPPAction · Post #2471 · 01.12.2024 г., 02:22
#dev#SinonJZH#merged 推荐下载 fix(crabpt):更新蟹黄堡升级条件和用户权限 (#2065) commit fix(crabpt):更新蟹黄堡升级条件和用户权限 (#2065)
@PTPPAction · Post #2468 · 30.11.2024 г., 08:14
#dev#SinonJZH#merged 推荐下载 fix(crabpt):更新蟹黄堡升级条件和用户权限 (#2065) commit fix(crabpt):更新蟹黄堡升级条件和用户权限 (#2065)
@PTPPAction · Post #2455 · 20.11.2024 г., 13:10
#dev#ShayLu#merged 推荐下载 feat: add site support: PTLGS (#2055) commit feat: add site support: PTLGS (#2055) * site: support PTLGS * change User Level name
@PTPPAction · Post #2384 · 04.10.2024 г., 11:10
#dev#G_LiuJunYu#merged 推荐下载 feat(raingfh): new site (#2004) commit feat(raingfh): new site (#2004) * feat(raingfh): new site 添加新增站点 雨 Co-Authored-By: ted423 <[email protected]> * Update config.json 添加tags - Co-authored
Hashtags
@PTPPAction · Post #2361 · 25.09.2024 г., 10:04
#dev#Bluice_Zhen#merged 推荐下载 修复:PTPP 使用 IMDB 编码搜索 Lolicon PT 的问题 commit 修复:PTPP 使用 IMDB 编码搜索 Lolicon PT 的问题 - 更新配置以确保 Lolicon PT 搜索的兼容性。 - 测试并确认功能正常。
Hashtags
@PTPPAction · Post #29 · 18.12.2022 г., 08:20
#dev#0600e0f feat(sportscult):增加升级条件、做种数、做种体积、时魔
@PTPPAction · Post #26 · 17.12.2022 г., 14:10
#dev#dda818b fix(hdai):修复搜索带空格的英文标题无结果;搜索结果显示种子状态和进度