TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 5 подобни публикации

Търсене: #verification

当前筛选 #verification清除筛选

"በስማችሁ ገንዘብ ተጠይቆባችሁ ያውቃል? ወዳጅ ዘመዶቻችሁ ለሳይበር ሌቦች ሰለባ እንዳይሆኑ ይህንን የጥንቃቄ መልዕክት ያጋሩላቸው!" *********************** በኢትዮጵያ በዋትሳፕ (WhatsApp)፣ በቴሌግራም (Telegram) እና በሌሎች የመልዕክት መላላኪያ ማህበራዊ ገጾች አማካኝነት የሚፈጸሙ የሳይበር ጥቃቶች እና የማጭበርበር ድርጊቶች በአሳሳቢ ሁኔታ መጨመራቸውን የኢንፎርሜሽን መረብ ደህንነት አስተዳደር (ኢመደአ) አስታወቀ። ወንጀለኞቹ ወቅታዊ ኩነቶችን፣ ሲምፖዚየሞችን እና ስብሰባዎችን እንደ አጋጣሚ በመጠቀም የተለያዩ የማታለያ ዘዴዎችን እንደሚጠቀሙ አስተዳደሩ ገልጿል። ከማጭበርበሪያ ስልቶቹ መካከልም "ነጻ የኢንተርኔት ፓኬጅ" እና "ልዩ የሥራ ቅጥር" የሚሉ አሳሳች መልዕክቶችን ማሰራጨት አንዱ መሆኑን ገልጿል። በሁለተኛ ደረጃ ደግሞ ተጠቃሚዎች በመልዕክቱ ውስጥ ያሉ ሊንኮችን (Links) እንዲጫኑ በማድረግ አካውንታቸውን መጥለፍ ነው። በሦስተኛ ደረጃ የተጠለፈውን አካውንት በመጠቀም በተጎጂው ስም ከቅርብ ዘመዶቹ የገንዘብ ድጋፍ መጠየቅ መሆናቸውን የኢንፎርሜሽን መረብ ደህንነት አስተዳደር (ኢመደአ) ባወጣው መረጃ አስታውቋል። እንዲህ አይነት ክስተቶችን ለመከላከል እና ተጎጂ ላለመሆን ማህበረሰቡ ከሳይበር ጥቃት ራሱን መጠበቅ እንዳለበት ያሳሰበው የኢንፎርሜሽን መረብ ደህንነት አስተዳደር በተለይ የሚከተሉትን መውሰድ እነደሚገባ በጥብቅ አሳስቧል፦ 1. አጠራጣሪ ሊንኮችን አለመክፈት፡ ከማይታወቁ አድራሻዎች የሚላኩ መልዕክቶችን "Report" እና "Block" ማድረግ። 2. ምስጢራዊ ኮዶችን አለመስጠት፡ በስልክ የሚላክ የማረጋገጫ ኮድን (Verification Code) ለማንም አካል አለመንገር። 3. የሁለትዮሽ ማረጋገጫ (Two-Step Verification)፡ ጠላፊዎች በቀላሉ አካውንትን እንዳይቆጣጠሩ ተጨማሪ የደህንነት ቁልፍ የሚፈጥረውን የቴክኖሎጂ ዘዴ በአስቸኳይ መተግበር። የኢንፎርሜሽን መረብ ደህንነት አስተዳደር (ኢመደአ) ወንጀለኞችን በህግ ተጠያቂ ለማድረግ እየሰራ መሆኑን ገልጾ፣ ማንኛውም አጠራጣሪ እንቅስቃሴ ሲያጋጥም በነጻ ስልክ መስመር 933 በመደወል ጥቆማ እንዲሰጥ ጥሪ አቅርቧል። #EthiopianBroadcastingCorporation#Verification#ኢመደአ

Libreware

@libreware · Post #1312 · 29.07.2024 г., 14:12

Harbor Decentralized p2p identity verification system. Identity management application written, targeting iOS, and Android, built on Polycentric. Create pseudonymous identities, make claims, link identities across applications. Checkout harbor.social, or docs.polycentric.io for more information What is Harbor and How it Works: https://peertube.futo.org/w/939a212d-920f-4411-b9b6-d60aa4ef4db7 https://gitlab.futo.org/polycentric/harbor/ #p2p#id#verification#futo

Libreware

@libreware · Post #1564 · 20.03.2026 г., 00:42

#Systemd Adds #Age#Verification & #Reddit#Linux Censors Age Verification Posts Plus: Which Open Source Operating Systems plan to include Age Verification? The Lunduke Journal compiles a list. Does It Age Verify?: https://github.com/BryanLunduke/DoesItAgeVerify https://lunduke.com https://www.youtube.com/watch?v=M3erhbwqIAM Lennart Poettering #microsoft#stalking#surveillance#backdoor#trojan

Venture Village Wall 🦄

@venturevillagewall · Post #3381 · 18.12.2024 г., 12:09

Fight Disinformation with AI INAR .IA Labs & Technologies has raised $1.21M for its innovative SaaS platform aimed at automating the detection and verification of disinformation across online content. Scheduled to launch on December 18, 2024, this multimodal and multilingual tool is set to enhance online security and information integrity. More details can be found at TrueFlag. #Funding#Technology#AI#SaaS#Disinformation#Verification#OnlineSafety#Security#Innovation#Automation#Multimodal#Multilingual#Integrity#Content#Platform#Launch #2024 #INAR#TrueFlag#Labs