TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 555 подобни публикации

Търсене: #technology

当前筛选 #technology清除筛选

r/ #technology Умная гитара без струн изГонконга Инструмент Lava Genie от стартапа Lava Music считывает взмахи рукой и постукивания пальцами, переводя их в музыку.

Hashtags

The first hard disk drive to reach the 1-gigabyte (GB) capacity weighed approximately 227-250 kgs (500 - 550 pounds) for the main unit. This device, the IBM 3380 direct access storage device, was announced by IBM in 1980. It was roughly the size of a refrigerator and carried a price tag of approximately $40,000. @googlefactss#technology

Hashtags

The internet is estimated to weigh about 50 grams, equivalent to a strawberry, based on the weight of the electrons used in electricity for data transfer. This does not account for the much larger physical weight of servers, cables, and data centers that support its infrastructure. @googlefactss#technology [read more....]

Hashtags

Game of Drones

@droneswar · Post #9590 · 07.12.2024 г., 12:35

r/ #technology Грустная история на вечер: в Северной Калифорнии робот пылесос пытается найти свой дом после землетрясения Видимо, он отключился от своей базы во время стихии, а теперь потерялся.

Hashtags

Game of Drones

@droneswar · Post #9479 · 21.10.2024 г., 15:51

r/ #technology Будущие космические роботы уже здесь Эти самоорганизующиеся роботы GITAI потенциально могут построить будущую инфраструктуру на Марсе и за его пределами. Скорость не так важна в космосе. Но выполнение работы и работа имеют первостепенное значение.

Hashtags

Daily Channels

@dailychannels · Post #6703 · 23.02.2026 г., 01:00

Channel: Hustlers News Members: ~4.55K 💢 Username: @hustlers_news Description: Channel dedicated to post news. Official site: www.hustlers.ly 🏷 Tags: #technology https://lve.to/pvphboywru

Hashtags

Daily Channels

@dailychannels · Post #6524 · 05.12.2025 г., 01:00

Channel: AI Post — Artificial Intelligence news Members: ~992.41K 💢 Username: @aipost Description: The #1 AI news source! We cover the latest artificial intelligence breakthroughs and emerging trends. Contact: @CaptainJamesCook 🏷 Tags: #technology https://telegramchannels.me/channels/aipost

Hashtags

Daily Channels

@dailychannels · Post #6468 · 07.11.2025 г., 13:00

Channel: benedict cumberTech Members: ~1.27M 💢 Username: @cumbertech Description: ️the most valuable from the world of technologies, AI, crypto and innovational science buy ads: @cumberAds or https://telega.io/c/cumbertech 🏷 Tags: #technology https://telegramchannels.me/channels/cumbertech

Hashtags

Daily Channels

@dailychannels · Post #6429 · 21.10.2025 г., 01:00

Channel: Analytics and growth mindset ️ Members: ~7.75K 💢 Username: @thinkbroadly Description: Free data analytics courses with certificates, hot internships and jobs - everything that needed data analyst. Buy ads: @maria_v2022 🏷 Tags: #technology https://telegramchannels.me/channels/thinkbroadly

Hashtags

Daily Channels

@dailychannels · Post #6402 · 09.10.2025 г., 13:00

Channel: UXLINK Members: ~331.36K 💢 Username: @uxlink_community Description: UXLINK official channel 🏷 Tags: #technology https://telegramchannels.me/channels/uxlink_community

Hashtags

123•••10•••20•••30•••40•••4647
ПредишнаСтр. 1 от 47Следваща