Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе.
У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи.
Вот как это может выглядеть:
1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое.
2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое
3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое
4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98"
...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать.
И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт:
"Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки).
Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы.
Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый.
#dev
Олександр Васюков представляет свой курс "Этническая и языковая политика в Центрально-Восточной Европе: перспектива меньшинств", начало которого переносится на 19 марта 2025.
📅 Записаться на курс можно до 17 марта на сайте www.smolny.rg/#courses.
Oleksandr Vasyukov introduces his course, "Ethnic and Language Policy in Central Eastern Europe: Minorities’ Perspective," beginning on March 19, 2025.
📅 Registration is open until March 17 at www.smolny.rg/#courses.
Не останавливаем поток отличных новостей (хоть где-то они должны быть, верно?) и спешим поделиться тем, что запускаем микрокурсы!
Что это и почему микро? 👀
Мир меняется настолько быстро, что уже сегодня надо освоить тот навык, о котором узнал только вчера. Микрокурсы решают эту проблему: это короткие образовательные видео по 20-50 минут, подготовленные нашими экспертами. Мы постарались охватить все диджитал-направления: дизайн, менеджмент, аналитику, исследования, hr и проектирование.
Как выбрать свой курс? 🤔
На сайте aic. courses вы можете собрать собственный бандл — пак из курсов, которые хотите изучить. Больше не нужно записываться на трехмесячный курс, если вам нужна только одна тема из него. Комбинируйте те знания, которые вам необходимы. Кстати, если собрать бандл из 3 и более курсов, то вы получаете скидку!
Будут ли домашние задания? 📝
Да, но мы их не проверяем. Материал вы изучаете самостоятельно. Кстати, у каждого микрокурса есть презентация-конспект, с которой будет проще запомнить материал.
Посмотрите шоурил, который мы сделали специально к запуску. Надеемся, вам понравится.
Изучайте то, что вам нравится и пригодится! Желаем удачи 🖤
Сайт курсов: https://courses.aic.ru/
#aic#courses
CoLearning Center oʻzining bepul kurslariga taklif qiladi
👨💻 INHA universiteti talabalari uchun ajoyib imkoniyat!
✅ Zamonaviy bilimlarni endilikda professionallar bilan birga mutlaqo bepulga oʻrganishingiz mumkin. Oʻrgangan bilimlaringizni esa “Project Managers” kompaniyasida amaliyot orqali davom ettirish imkoniyati ham mavjud.
Bizda aynan qaysi kurslar oʻtiladi?
- Frontend development
- Backend development
- Grafik dizayn
- SMM
📬 Ushbu yoʻnalishlardan oʻzingizga mos boʻlgan kursni tanlang va roʻyxatdan oʻting! Roʻyxatdan oʻtgan oʻquvchilar birinchi guruh sifatida intervyuga chaqiriladi!
👉 Roʻyxatdan oʻtish
📌 Eslatib oʻtamiz, ro'yxatdan o'tishning ohirgi sanasi 26-sentabr! Ishtirokchilar suhbat asosida 30-sentabrga qadar saralab olinib, darslar 2-oktabrdan boshlanadi.
#INHA#courses#CLC
@colearninguz
Пятидневный интенсив по GenAI-агентамот Google & Kaggle
#links_with_intro#genai#courses
https://rsvp.withgoogle.com/events/google-ai-agents-intensive_2025/home
Курс по GenAI, про который я тут раньше писал, хайпанул до рекорда Гиннесса по самой большой недельной онлайн-аудитории (почти 30к чел).
Теперь курс обновили с фокусом на… агентах (no prize for guessing).
Пройдет с 10 по 14 ноября. Авторы - исследователи и инженеры Google ML, в том числе из Deepmind, будут заходить и гости. Площадка - Kaggle. Формат - live-стримы и практические задания. Обсуждения в дискорде.
Темы курса:
* День 1: агенты и их архитектуры
* День 2: тулинг и MCP
* День 3: context engineering и память
* День 4: оценка качества агентов, логирование, трейсинг
* День 5: A2A-протокол и агенты в проде
Конечно, все будет на Google Cloud Platform, а основной фреймворк - Google Agent Development Kit (ADK).
Все даром (то есть товар - это вы), нужен только аккаунт Kaggle.
🌍 Markaziy Osiyo mintaqasi bo‘yicha ACCA vakillari bilan uchrashuv
🔍Batafsil
🇺🇸ENG
🇷🇺RU
#GraduateSchool#Memorandum#ACCA#Courses
Web-site| Telegram | Facebook |Instagram
🎞Germaniyaning Frayberg konchilik akademiyasi (TUBAF) vakillari bilan tashkil etilgan uchrashuvidan videolavhalar.
👨🎓Mazkur uchrashuv mamlakatimizda iqtisodiy yo‘nalishlar hamda MBA o‘quv dasturlarni takomillashtirishda yana bir qadam bo'ldi.
⚡️ Tez orada korporativ sektor vakillari va Oliy maktab tinglovchilari uchun hamkorlikda malaka oshirish kurslarni yo'lga qo'yish rejalashtirilgan!
#GraduateSchool#TUBAF#Germany#Courses
🔝Web-site |🔝Facebook |🔝Instagram | 🔝Youtube
🇺🇿 Germaniyaning Frayberg konchilik akademiyasi (TUBAF) vakillari bilan uchrashuv tashkil etildi
📊 Uchrashuvda TUBAFning Barqaror rivojlanish va kommunikatsiyalar bo‘yicha prorektori Andreas Horsh hamda Biznes boshqaruvi va iqtisod fakulteti dekani Mihael Xyok ishtirok etdi.
🇺🇿Batafsil
🟢 A meeting was organized with the Technical University of Freiberg Mining Academy (TUBAF)
⛈ The meeting was attended by Andreas Horsch, Vice-Rector for Sustainability and Communications at TUBAF, and Michael Höck, Dean of the Faculty of Business Administration and Economics.
🇬🇧More details
🖥 Была организована встреча с Техническим университетом Фрайбергской горной академии (TUBAF)
🌐 Во встрече приняли участие проректор по устойчивому развитию и коммуникациям TUBAF Андреас Хорш и декан факультета делового администрирования и экономики Михаэль Хёк.
🇷🇺Подробнее
#GraduateSchool#TUBAF#Germany#Courses
🔝Web-site |🔝Facebook |🔝Instagram | 🔝Youtube
🚀 Tez kunlarda start oladigan oflayn kurslarimizni intizorlik bilan kutyapsizmi? Siz yolg‘iz emassiz! Bizning tajribali o‘qituvchilarimiz ham o‘z bilim va ko'nikmalarini ulashishga tayyor. Keling ular safi bilan yaqindan tanishtiramiz:
1️⃣ Backend lektor Xaitmetova Xojarbu
Colearning Academy’dagi onlayn IT darslari bilan tanilgan Python va Backend dasturchisi.
2️⃣ Frontend lektor Shahzod Qudratov
Matn.uz, birgayengamiz.uz, faxriylar.uz kabi yirik loyihalarida frontend boʻyicha oʻzining professional faoliyati bilan hissa qoʻshgan.
3️⃣ Grafik dizayn - lektor Murodxoʻja Muratov
Project Managers kompaniyasi bosh dizayneri. Yirik brendlar bilan ishlashda katta tajribaga ega.
4️⃣ SMM va Copywriting: Mahin Nursaidova va Sadriddin Abdurahimov - SMM bo‘yicha yetarli tajriba va bilimga ega mutaxassislar.
#CLC#INHA#courses#staytuned
@colearninguz
Language Learning Courses 📕
This section updates daily (some courses may expire fast), so save it and check it regularly.
You’ll find all kinds of language courses — not just English.
#LanguageLearning#English#Spanish#Learning#Courses