TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #digitalfuture

当前筛选 #digitalfuture清除筛选
AI & Law

@ai_and_law · Post #73 · 02.08.2023 г., 07:04

Leading the Way in Responsible AI: The EU's Vital Opportunity Hello, AI enthusiasts! Today, we share a policy brief by Pegah Maham and Sabrina Küspert from the Stiftung Neue Verantwortung. They highlight the EU's significant chance to take the lead in responsible AI development through the AI Act and beyond. But to seize this opportunity, understanding the risks associated with general-purpose AI models is essential. 🔹 Risks from Unreliability: One major concern is the lack of control over AI models' behavior. This unreliability could lead to serious issues like discrimination and stereotype reproduction, spreading misinformation, and violating individual privacy. 🔹 Misuse and Dual-Use AI Models: The dual-use nature of some AI models poses another challenge. While they offer immense benefits, they can also be misused by malicious actors for cybercrime, biosecurity threats, and politically motivated purposes. 🔹 Systemic Risks: As AI rapidly integrates into our society, systemic risks emerge. These risks include economic power concentration and inequality, ideological homogenization, and disruptions from the lagging adaptation of society. By comprehending and addressing these risks, the EU can establish itself as a global leader in responsible AI development. #ResponsibleAI#AIRegulation#AIAct#AIChallenges#EUAI#TechPolicy#DigitalFuture#AICommunity

#Beijing_Review🇨🇳📕[PDF]⬇️ 6 #November2025 #Weekly_Magazines For learning, for free(dom). @backupofmagazines Beijing Review spotlights China’s #15thFiveYearPlan and its vision for a coordinated, green, and globally inclusive future. The issue unpacks Xi–Trump #Summit diplomacy in Busan, China’s push for #GenderEquality partnerships, and #RCEP as an engine for regional #Integration. Articles explore how strategic planning drives #Sustainability and global development under the banner of #Modernization. From energy transition to cyberspace security, the issue portrays a confident China charting a course for shared growth and stability. #China#GlobalGovernance#Sustainability#FiveYearPlan#RCEP#XiTrumpMeeting#ClimateAction#DigitalFuture#GenderEquality#AsiaPacific