TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #description

当前筛选 #description清除筛选
VmShell VPS Channel

@vmshell · Post #1679 · 03.03.2025 г., 09:15

VPS内存太小,VmShell,小内存自动清理缓存脚本 “VPS小内存硬盘日志定时清理工具”是为了针对系统如何清理VPS自动缓存,保持系统的清洁与活力的小工具,喜欢的朋友可以给我们点亮我们的小星星 VPS小内存硬盘日志定时清理工具,作者:Vmshell INC,是美国怀俄明注册正规企业,现注册有自有网络运营ASN号:147002;提供香港CMI线路高速网络云计算中心和美国云计算中心,小巧灵动的VPS为全球网络提供全方位服务, 官网订购地址: https://vmshell.com/; 企业高速网络: https://tototel.com/; TeleGram讨论:https://t.me/vmshellhk; TeleGram频道:https://t.me/vmshell; 提供微信/支付宝/美国PayPal支付(3日内无条件退款); 登录VPS的SSH之后,执行如下代码后reboot重启服务器 第一步:创建文件夹和文件名: mkdir -p /opt/script/cron && vim /opt/script/cron/cleanCache.sh 输入如下文字,之后":wq"保存退出 #!/bin/bash #description: 清除缓存 echo "开始清除缓存" sync;sync;sync #写入硬盘,防止数据丢失 chmod -R 777 /opt/script/cron #修改其文件的權限 chmod -R 777 /var/spool/mail #修改其郵件消息的權限 #sleep 10 #延迟10秒 echo 1 > /proc/sys/vm/drop_caches echo 2 > /proc/sys/vm/drop_caches echo 3 > /proc/sys/vm/drop_caches echo "结束清除缓存" #description: 删除30天之前的r日志文件… https://linuxword.com/?p=43179

STAR VET BOOKS

@starvetbooks · Post #4732 · 24.11.2024 г., 04:18

https://t.me/starvetbooks #PENSTREP_INJECTION (Procaine penicillin & Dihydrostreptomycin injection) #PRODUCT: Suspension #ADMINISTRATION ✓Parenteral #COMPOSITION ✓Procaine penicillin: 200ml ✓Dihydrostreptomycin: 250ml ✓Sulphate: 200 mg. ✓Excipients: ad1 ml. #DESCRIPTION The combination of #PROCAINE_PENICILLIN_G & #DIHYDROSTREPTOMYCIN acts additive and in some cases synergistic. #PROCAINE_PENICILLIN_G A Narrow-spectrum, a bactericidal against Gram-positive bacteria, #DIHYDROSTREPTOMYCIN An aminoglycoside, a bactericidal, against Gram-negative. #INDICATION/USES Arthritis, mastitis and gastrointestinal, respiratory and urinary tract infections rapid healing of wound/injury. NEXT ⏭️👇