TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #mssqlserver

当前筛选 #mssqlserver清除筛选
MDC Uzbekistan

@mdcuzbekistan · Post #227 · 26.11.2021 г., 09:44

#dotnet#middle#MSSQLserver Applied Labs is looking for a .Net Developer Salary: $1500-3000 Location: 100% remote job, but we have an office in Tashkent, if you feel comfortable working from the office. All stages of recruitment are carried out remotely by calling a video (Zoom). You will need to have: - Proficiency in C #, .NET Framework and .NET Core; - Understanding how web protocols (HTTP, HTTPS) and REST / SOAP API work; - Knowledge of MS SQL Server, Oracle, PostgreSQL: the ability to design a database structure, write and optimize SQL queries and stored procedures; - 3+ years of work experience; - Fluency in English (verbal and written communication); - Bachelor's Degree in Computer Science, Engineering or related field or strong track record proving the equivalent level of experience; - Capability to multi-task with strong attention to detail; - Ability to work in a fast-paced, agile environment and resolving unplanned incidents quickly; - Outstanding communication skills, including the ability to effectively present information in both technical and non-technical terms and train users using non-technical terms; - Strong customer service focus; - Excellent team player skills with the ability to influence others. It would be an added bonus if you have: - Azure, Azure DevOps ; - M365 is a huge plus; - Jira and Confluence; - MS Graph API’s. We would love to see: - A sound knowledge of software engineering; - Excellent analytical skills; - Sourcing requirements from customers and suggesting appropriate solutions; - Quick generating of POC (proof of concepts) and demos; - Self-motivated, proactive, independent & responsive candidate, the specialist, who requires little supervisory attention We offer: - Flexible office policy - You can work from wherever you want or from our cozy office in Tashkent. You can even combine both - few days in the office and a few days remote; - 5/2 work week, 8 hours a day (you are expected to be available for communication between 18:00 to 23:00 Tashkent time, as you'll be working with the US team located in New York); - Official employment in accordance with Uzbekistan's Labor Laws; - Frequent team-building activities and internal hackathons; - Health insurance; - English courses; - Group exercises; - Reimbursement for sport. Send an email with your resume in English and the subject line "Data Engineer" to [email protected] To apply for this position, please feel out the application form here: https://appliedlabs.pinpointhq.com/en/jobs/32045 👉Подписаться на канал @UzDev_Jobs