TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #refining

当前筛选 #refining清除筛选

🚢Sinopec смещает фокус на экспорт на фоне снижения загрузки НПЗ. Китайская нефтехимическая группа Sinopec фиксирует снижение загрузки перерабатывающих мощностей в I-м квартале 2026 г, одновременно усиливая экспорт химической продукции. Коэффициент загрузки НПЗ снизился до 83% (-7,6 п.п. г/г), что связано с перебоями поставок сырья на фоне конфликта на Ближнем Востоке. Основным фактором выступает ограничение потоков через пролив Ормуз (Strait of Hormuz), через который проходит около 20% мировых поставок нефти и газа, что привело к дефициту сырья для азиатских переработчиков и снижению маржи переработки, несмотря на локальный рост цен на нефтепродукты. В ответ Sinopec переориентирует стратегию на экспорт: ожидается рост поставок химической продукции на 26% до 3,65 млн тонн в 2026 г. Компания также активно использует государственные механизмы поддержки, включая доступ к коммерческим запасам нефти и экспортные квоты. Экспорт нефтепродуктов остаётся значительным (4,32 млн тонн в I-м квартале), при этом внутренние ограничения на экспорт топлива в Китае подчёркивают приоритет обеспечения внутреннего рынка. Дополнительным негативным фактором стали убытки в СПГ-сегменте из-за роста спотовых закупок и перебоев поставок по долгосрочным контрактам. Стратегия Sinopec отражает адаптацию крупнейших переработчиков к нестабильности поставок: диверсификация сырья и акцент на экспорт позволяют компенсировать снижение внутренней загрузки и поддерживать финансовые показатели. 📌Sinopec — основана в 2000 году, крупнейшая нефтеперерабатывающая компания мира по мощности, государственная компания КНР. #oil#refining#China#energy#shipping

🚢Азиатские НПЗ сокращают загрузку из-за перебоев поставок нефти из Персидского залива. Нефтеперерабатывающие заводы Азии, зависимые от ближневосточной нефти, могут сократить производство из-за перебоев поставок после эскалации конфликта США–Иран. Транзит через Ормузский пролив, через который проходит около 20% мировой нефти, практически остановился после атак на суда. Азия получает около 60% нефти из стран Ближнего Востока, поэтому регион наиболее уязвим. Альтернативные поставки возможны из Бразилии, Западной Африки и США, однако время доставки превышает месяц, а фрахтовые ставки резко выросли. Премии на бразильскую лёгкую нефть для поставки в Китай достигли $13–14 за баррель к ICE Brent против $2–3 до конфликта. Стоимость перевозки нефти танкером типа VLCC из Мексиканского залива США в Китай выросла до $22,5 млн за рейс (+30% за несколько дней). Аналитики ожидают сокращение загрузки НПЗ на 5–20%, в отдельных случаях до 30% от проектной мощности. Некоторые китайские переработчики, включая Zhejiang Petrochemical и Fujian Refining and Petrochemical, уже начали снижать переработку. Для морского рынка это означает рост спроса на дальние маршруты из Атлантического бассейна, усиление тонно-мильного эффекта и дальнейшее давление на ставки танкеров VLCC. 📌FGE NexantECA — международная консалтинговая компания в области энергетических рынков, образованная после объединения FGE и NexantECA. Специализируется на аналитике нефти, газа и нефтехимии; компания является частной и принадлежит партнёрам и инвесторам. #OilMarket#VLCC#Hormuz#Refining#EnergyTrade

🚢Orlen превзошла ожидания по EBITDA на фоне сильной переработки. Польская энергетическая группа Orlen опубликовала квартальные результаты: скорректированная EBITDA LIFO составила PLN 12,15 млрд ($3,4 млрд), превысив консенсус (PLN 11,4 млрд) несмотря на снижение на 15% г/г. Поддержку обеспечил сильный downstream-сегмент (переработка и нефтехимия) на фоне благоприятной маржинальной среды. Чистая прибыль за квартал — PLN 3,13 млрд, ниже ожиданий (PLN 4,8 млрд) из-за обесценивания активов на PLN 3,34 млрд, включая PLN 2,2 млрд в downstream (переработка, нефтехимия и «новая химия»). Влияние оказали и более низкие цены на нефть и газ. Компания анонсировала капвложения PLN 36,3 млрд в 2026 году (против PLN 32,6 млрд годом ранее). Среди ключевых проектов — первая офшорная ВЭС Польши в Балтийском море и газовая электростанция в Грудзёндзе. 📌Orlen основана в 1999 году (консолидация польских НПЗ). Компания публичная (WSE); контрольный пакет принадлежит государству Польша через Министерство государственных активов. #energy#refining#Poland#downstream#Orlen