TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #techcrunch

当前筛选 #techcrunch清除筛选
Venture Village Wall 🦄

@venturevillagewall · Post #3594 · 20.12.2024 г., 14:00

OpenAI CEO Salaries Revealed Recent data published by OpenAI reveals salary details for its CEO Sam Altman and former CEO Emmett Shear. Altman earned $76,001 for 2023, translating to approximately $318 per workday over 239 days. In contrast, Shear received $322,201 for just 10 days as CEO, costing around $322 daily. Additionally, Ilya Sutskever earned $322,201, or $1,294 per day. Shear is now starting an AI venture, Stem AI, backed by Andreessen Horowitz, with a focus on human behavior alignment. Notably, the company was registered prior to his brief tenure at OpenAI. #OpenAI#SamAltman#EmmettShear#Salary#AI#TechNews#Startups#Funding#IlyaSutskever#StemAI#AndreessenHorowitz#Business#Leadership#TechCrunch #2023 #StartupLife#Innovation#HumanBehavior#Equity

Venture Village Wall 🦄

@venturevillagewall · Post #3711 · 25.12.2024 г., 10:00

Edtech Investments Hit 2014 Low 📉 Global investment in Edtech startups plummets to $3 billion this year, the lowest since 2014. Startups are distancing themselves from the Edtech label, impacting investor interest. 🧑‍🦼 'Моторика' acquires 51% of a wheelchair manufacturer, positioning itself in assistive technology ahead of an IPO planned for 2026. 🤖 OpenAI considers creating a humanoid robot, but new AI models remain the priority. ✈️ Lilium, the electric aircraft developer, may be saved by a consortium after announcing closures and layoffs. Read more: Financial Times, Vedomosti, The Information, TechCrunch #Edtech#Investment#Startups#AI#Robot#AssistiveTechnology#Lilium#MOTORIKA#FinancialTimes#Vedomosti#TheInformation#TechCrunch#Singapore#Cryptocurrency#UserExperience#MarketTrends#Technology#Innovation#Business#Funding