@botsgram_cu · Post #3295 · 16.12.2020 г., 12:09
@SangMataInfo_bot Qué puede hacer este bot? Reenviar cualquier mensaje a este chat para ver el historial del usuario. Idioma: Inglés (visto en @BotsGram_cu) #user, #chat, #group
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #851 · 2.08
Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev
Hashtags
Търсене: #user
@botsgram_cu · Post #3295 · 16.12.2020 г., 12:09
@SangMataInfo_bot Qué puede hacer este bot? Reenviar cualquier mensaje a este chat para ver el historial del usuario. Idioma: Inglés (visto en @BotsGram_cu) #user, #chat, #group
@OnePlus13Series · Post #346 · 13.11.2025 г., 15:51
SunOS Project | Android 16 | Oneplus 13 ✍️ Details: - Version: bienor - Codename: #dodge - Type: #user#gapps - Released: 29/09/25 🔽 Download : ROM [ Gdrive | Mirror | SF ] // Images 🆘 Support group: Here ✨ Changelogs: Here 🌳 Source: Here | DT | sm8750 📸Screenshots: Here 💰 Donate: Here (Server) 🔖 Tags : #SunOS#AOSP#ROM#Official#A16#QPR0 ⚙️Installation: 🚨 Firmware is not included with this rom. Please flash fw on both slots to avoid potential issues ➡️ CMDs: fastboot flash init_boot init_boot.img fastboot flash boot boot.img fastboot flash recovery recovery.img fastboot flash vendor_boot vendor_boot.img fastboot -w fastboot reboot recovery ➡️Recovery: • Factory reset (wipe/format data) • ADB sideload the rom zip & Reboot 📔Note: - Clean flash is mandatory coming from SunOS A15 and make sure remove google accounts and lockscreen password to avoid frp lock - ESIM support is dropped 👤 Developer: @Chandu_078 🔔 Updates: @OnePlus13Series 💬 Discussion: @OnePlus13SeriesChatRoom
@botsgram_cu · Post #3365 · 06.01.2021 г., 12:13
@gdprbot Qué puede hacer este bot? El bot GDPR oficial de Telegram. Idioma: Inglés (visto en @BotsGram_cu) #data, #privacy, #telegram, #user, #download, #request, #claim
@repo_science · Post #3180 · 12.05.2023 г., 19:53
#webScraping#Python#Scrapy 🐍 Scrapy course - Python web scraping for beginners The Scrapy #Beginners Course will teach you everything you need to learn to start scraping websites at scale using #Python Scrapy. Topics - Creating your first #Scrapy spider - #Crawling through websites & scraping data from each page - Cleaning data with Items & Item Pipelines - Saving data to CSV files, #MySQL & #Postgres#databases - Using fake #user-agents & headers to avoid getting blocked - Using #proxies to scale up your web scraping without getting banned - Deploying your #scraper to the cloud & scheduling it to run periodically 🗣️ Joe Kearney. 🔗Link 📢#youtube ⭐️ Resources ⭐️ Course Resources - Scrapy Docs - Course Guide - Course Github - The Python Scrapy Playbook ----- Main channel: @repo_science Coupons: @freecoupons_reposcience -----
@botsgram_cu · Post #3290 · 15.12.2020 г., 11:47
@RulesRulesBot Qué puede hacer este bot? Este bot saludará a los nuevos miembros con un mensaje de bienvenida, y también puede especificar un texto de reglas. Idioma: Inglés (visto en @BotsGram_cu) #rules, #welcome, #start, #group, #member, #new, #join, #enter, #message, #user