Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

#dev

Резултати

Намерени 2 подобни публикации

Търсене: #predictiveanalytics

当前筛选 #predictiveanalytics清除筛选

Data Science Jobs

@datasciencejobs · Post #1684 · 21.09.2023 г., 07:01

Намери подобни Прегледай

#вакансия#job#datascience#mlengineer#research#predictiveanalytics Роль: Middle ML engineer в IDecide Локация компании и заказчика: РФ Работать можно удалённо. Москва или Подмосковье - преимущество с т.з. возможности пересекаться в офисе с командой). Такое есть команда в Иваново. Доход: 200-250К net Отклики присылать: @mipt_nz Статус: есть экспериментальный код модели предсказания оттока клиентов для компании финансового сектора. Модель включает в себя предобработку данных, генерацию фичей, ML модель и rule-based часть. Задачи: Необходимо сделать рефакторинг кода для внедрения в продакшен, для этого: - разобраться в текущем коде модели (в этом помогут текущие разработчики модели); - написать тесты; - переструктурировать код в соответствии со стандартами индустрии (за образец можно взять классы scikit-learn); - сопроводить код комментариями и документацией. Требования: - знание классического ML и python; - опыт написания продакшен кода в ML; - хорошее знание ООП; - знание структуры классов scikit-learn, либо желание разобраться в ней; - базовое владение: git, командная строка linux, docker, понимание сервисной архитектуры. Интересный проект по предсказанию поведения пользователей на основе исторических данных. Присоединяйтесь, ждём Вас в команду 🤗

Hashtags

#вакансия #job #datascience #mlengineer #research #predictiveanalytics

Crypto M - Crypto News

@CryptoM · Post #64826 · 10.04.2026 г., 02:43

Намери подобни Прегледай

🚀 AI's Impact on Investment and Trading: Insights from Nansen CEO PANews posted on X (formerly Twitter) about a discussion with Nansen CEO Alex Svanevik on the evolving role of AI in investment and trading. Svanevik highlighted that 'smart money 2.0' is transforming into a predictive system, with agent trading expected to surpass human trading by 2028. However, he emphasized the need for users to build a 'trust ladder' before fully relying on trading agents. The conversation also covered the implementation of tools like OpenClaw in enterprise settings, where safety is prioritized over speed. Svanevik shared insights on how the Nansen team utilizes OpenClaw and how AI is reshaping team structures. He noted that 'judgment' is becoming the most scarce resource within AI-native companies. Svanevik further pointed out that low latency, overcoming AI bottlenecks, and open-source solutions will define the next generation of agent infrastructure. #AI#Investment#Trading#FinTech#MachineLearning#PredictiveAnalytics#OpenSource#EnterpriseAI#FinancialTechnology#AlgorithmicTrading

Hashtags

#ai #investment #trading #fintech #machinelearning #predictiveanalytics #opensource #enterpriseai #financialtechnology #algorithmictrading