TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 79 подобни публикации

Търсене: #programming

当前筛选 #programming清除筛选
📓 Real Spencer Woo

@realSpencerWoo · Post #33 · 17.12.2019 г., 08:45

#技术#Programming 📻 来观赏一下用最美丽的古典文学撰写代码的快感:wenyan-lang GitHub | Online IDE 绿蚁新醅酒,红泥小火炉。晚来天欲雪,能饮一杯无?wenyan-lang 让我们借助于中国古典文言文来编写程序,之后我们即可将文言文编译为清晰的 JavaScript 或者 Python 代码,并直接运行。wenyan-lang 的语法很好理解,比如我们声明三个变量:var a=1, b=3, c=5;。用 wenyan-lang 来撰写即为: 吾有三數。曰一。曰三。曰五。名之曰「甲」曰「乙」曰「丙」。 另外,作者还给出了包括快排、斐波那契数列、汉诺塔等等经典问题或者算法的样例,位于 GitHub - wenyan-lang/examples,有兴趣的同学可以前往观摩。编写好的 wenyan-lang 代码,还可以通过编译器自带的 render.js 渲染为一张优美的 svg 图片,高贵。👍 📮 Via channel: @realSpencerWoo

Earth&Climate Tech

@earth_climate_tech · Post #291 · 15.05.2023 г., 16:00

Карта планеты GitHub Посмотрите какой забавный проект - Map Of Github🤩. Каждая точка — это проект GitHub. Размер точки указывает на количество звезд, которые получил проект. Точки соединены в виде графа и образуют кластеры, которые автор объединяет в страны! На карте более 400 000 проектов, сгруппированных по 1100 странам планеты GitHub. Названия стран прикольные - Land of Unity, Hackistan и конечно мои любимые AILandia и Pythonia! В AILandia есть мои любимые штаты - U.S. of Climate, Maplands и Undegrounds, где живут проекты Earth&Climate Tech! Можно нажать на проект, посмотреть его описание и заценить схожие проекты (как на картинке с проектом GemPy). Практического значения может и немного, но визуализация и исполнение просто 🔥! #software#programming

123•••67
ПредишнаСтр. 1 от 7Следваща