TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #winapps

当前筛选 #winapps清除筛选

📣WinApps | 自建加速的纯净 Windows 软件仓库 🖼 标签:#WinApps#软件下载#Windows#开源软件#Scoop 📱 简介:WinApps是一位开发者自建的 Windows 软件资源站,为国内用户提供原汁原味的官网下载源 + 代理加速下载。作者出于“分享干净软件”的初心,亲自筛选超过 100+ 实用程序,覆盖浏览器插件、系统工具、开发软件等领域,让用户免去从杂乱下载站找资源的烦恼。 网站坚持 不改包、不注入、不破解 的纯净原则,所有下载链接都指向官方源或作者自建的加速镜像。支持 Scoop 命令行安装、Windows 系统镜像直链下载,无需网盘跳转、无需登录,一键即可安装。 💬 小编有话说:理想的软件下载站——无套路、无弹窗、无广告,纯粹到极致 🧭在线直达官网 ♥@xiuerSearch 搜索历史资源 👥频道 | 👤群聊 | 👁‍🗨中文包

GitHub Trends

@githubtrending · Post #15087 · 23.08.2025 г., 12:00

#shell#cassowary#docker#freerdp#gnome#hacktoberfest#integration#kde#libvirt#linux#linux_app#nautilus#nix_flake#podman#qemu#qemu_kvm#seamless#winapps#windows#wine#xfce You can run Windows applications like Microsoft Office and Adobe Creative Cloud directly on your Linux desktop (KDE, GNOME, or XFCE) as if they were native apps using WinApps. It works by running Windows inside a virtual machine (using Docker, Podman, or libvirt) and then showing Windows apps seamlessly on Linux with FreeRDP. Your Linux home folder is accessible in Windows, and you can right-click files in Linux to open them with Windows apps. This lets you use all Windows programs without leaving Linux, improving productivity and convenience without needing dual boot or separate hardware. https://github.com/winapps-org/winapps