TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #commercialization

当前筛选 #commercialization清除筛选
Руслан Туматов

@RUSTumatov · Post #72 · 23.12.2025 г., 12:11

💡 Гранты до 350 млн тенге от АО «Фонд науки» Сегодня у меня была интересная встреча - Абай Еркебалан — членом РегПолитСовета партии «Байтак», экс-природоохранным прокурором Генеральной Прокуратуры РК, руководителем компании по экологическому консалтингу, резидентом Международного технопарка Astana Hub, магистром технических наук. Абай Мамытханович рассказал мне о трёх разработках в области дезинфекции и очистки воды — слушать было действительно увлекательно. Хотя мой брат всегда говорит мне: «no politic, no religion», сегодня я изменил сам себе. Потому что речь шла о программе грантов для коммерциализации научных разработок, где максимальная сумма может достигать до 350 млн тенге. 📌 Но вместе с возможностями есть и сложности — Абай Мамытханович поделился опытом подачи заявок и теми барьерами, с которыми сталкиваются разработчики. ❓ У меня вопрос к сообществу: Кто-нибудь уже участвовал в этой программе? Какие технологии удалось коммерциализировать? Как реально работает механизм грантов и насколько он доступен для бизнеса? Мне самому пока сложно разобраться в деталях, но очень хочется услышать живые истории и опыт тех, кто прошёл этот путь. #Innovation#Science#Kazakhstan#WaterTreatment#Commercialization

Venture Village Wall 🦄

@venturevillagewall · Post #3618 · 21.12.2024 г., 10:22

New Wave Biotech Secures $1.25M Investment New Wave Biotech has raised $1.25M to enhance its Bioprocess Foresight software, which aids biomanufacturing innovations in scaling processes, accelerating commercialization, and promoting sustainability. The software offers bioprocess modeling, operation simulations, and economic analysis tools to optimize biomanufacturing efficiency and sustainability. Learn more at New Wave Biotech. #Biotech#Funding#Bioprocessing#Sustainability#Software#Investment#SupplyChain#Innovation#TechAnalysis#Manufacturing#Commercialization#Scale#AnalysisTools#ProcessModeling#Downstream#TechEconomic#ProcessOptimization#GlobalSupplyChain

Venture Village Wall 🦄

@venturevillagewall · Post #3646 · 21.12.2024 г., 10:24

Accelergen Energy Raises $20M Accelergen Energy has secured $20 million in funding as of December 19, 2024. The firm focuses on delivering clean power assets characterized by robust and sustainable locational value through strategic investments, development, commercialization, and optimized operations. For more details, visit Accelergen Energy. #Accelergen#Energy#Funding#CleanPower#Investment#Sustainability#RenewableEnergy#Development#Commercialization#Operations#ClimateTech#GreenEnergy#Ecosystem#Infrastructure#PowerAssets#Technology#StrategicInvestment#CleanTech#EcoFriendly#LocationalValue