Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе.
У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи.
Вот как это может выглядеть:
1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое.
2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое
3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое
4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98"
...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать.
И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт:
"Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки).
Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы.
Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый.
#dev
Curated Crypto | ꘜ
👛Q2 2025 just hit a $10 BILLION milestone in crypto VC funding. Link.
But this isn’t hype chasing. It’s smart, disciplined money flowing into compliance-first, infrastructure plays that are built to last!
Author: Green But Red
#VC
Денис Мантуров объявил о переводе экономики на новый технологический уклад и усилении позиций России в космосе
Будущий первый вице-премьер выступил на заседании комитета Госдумы по промышленности и торговле и обозначил приоритетные направления технологического развития и господдержки:
🌌Расширение спутниковых группировок
🌌Создание новых ракет-носителей на альтернативном топливе, в том числе многоразовых
🌌Развитие инфраструктуры космодромов
🌌Разработка программ исследования дальнего космоса
🌌Строительство российской орбитальной станции
🌇Выпуск промышленных роботов
🌇Формирование полного производственного цикла по химической продукции
🌇Локализация электроники
🌇Создание гражданского транспорта
🌇Наращивание возможностей предприятий оборонно-промышленного комплекса
Заявления о гос.поддержке развития космоса - позитивный сигнал для инвесторов в космические проекты. В портфеле нашего фонда сейчас 2 spacetech-проекта: в 2023 г. мы выделили на первый этап их развития до 250 млн руб. Обе команды занимаются разработкой ракет сверхлегкого класса для доставки полезной нагрузки массой до 300 кг груза на солнечно -синхронную орбиту.
#космос#vc
@voskhodvc - канал венчурного фонда "Восход"
https://amp.rbc.ru/rbcnews/economics/12/05/2024/6640e7c49a79479eaf1ce780?utm_source=amp_textincutes
Табличка по #Web3 проектам закрывшие раунды в июне 2023.
Мой фаворит - Maverick Protocol новый DEX с концентрированной ликвидностью. Над похожим решением и мы сейчас работаем.
#инвестиции#vc
💎 Глобальная карта инвестиционного риска в 2026 году от VC
Соотношение риска и доходности на глобальных рынках существенно различается. По оценкам профессора Асват Дамодаран, премия за риск отражает дополнительную доходность, которую инвесторы требуют за вложения в конкретную страну: чем выше показатель, тем выше воспринимаемый риск.
⚖️ Оценка основана на кредитных рейтингах стран и ставках заимствования; при отсутствии ликвидного долгового рынка используются сравнительные показатели фондовых индексов развивающихся стран.
Наиболее высокие премии за риск (до 30,9%) характерны для стран с военными конфликтами, санкциями и экономической нестабильностью — таких как Беларусь, Ливан, Судан и Венесуэла. В группе повышенного риска (около 19,8%) также находятся Куба, Украина, Сирия и Йемен.
🌱 К числу наиболее стабильных рынков относятся Канада, Германия, Швейцария, Сингапур, Швеция и Нидерланды с премией на уровне ~4,2%. В 🇺🇸США показатель немного выше — 4,5%, оставаясь при этом в группе стран с минимальным риском (менее 5%).
🇺🇿 Премия за риск у Узбекистана составила 8,9%. Аналогичный показатель у Турции, Армении, Непала и Македонии. В то же время у 🇷🇺России данный показатель на уровне 8,1%, а у 🇰🇿Казахстана — 6,3%.
—
💎 VC'dan 2026-yilda global investitsiya xavflari xaritasi
Global bozorlarda risk va daromadlilik nisbati sezilarli darajada farq qiladi. Professor Asvat Damodaran baholashlariga ko‘ra, risk mukofoti investorlar ma’lum bir mamlakatga sarmoya kiritish uchun talab qiladigan qo‘shimcha daromadni anglatadi: ko‘rsatkich qanchalik yuqori bo‘lsa, qabul qilinadigan risk ham shunchalik yuqori bo‘ladi.
⚖️ Baholash mamlakatlarning kredit reytinglari va qarz olish stavkalariga asoslangan; agar likvid qarz bozori mavjud bo‘lmasa, rivojlanayotgan mamlakatlar fond indekslarining solishtirma ko‘rsatkichlaridan foydalanilgan.
Eng yuqori risk mukofotlari (30,9% gacha) harbiy mojarolar, sanksiyalar va iqtisodiy beqarorlik kuzatilayotgan mamlakatlarga xos — masalan, Belarus, Livan, Sudan va Venesuela. Yuqori risk guruhiga (taxminan 19,8%) Kuba, Ukraina, Suriya va Yaman ham kiradi.
🌱 Eng barqaror bozorlar qatoriga Kanada, Germaniya, Shveysariya, Singapur, Shvetsiya va Niderlandiya kiradi, bu yerda risk mukofoti ~4,2% darajasida. 🇺🇸AQShda bu ko‘rsatkich biroz yuqoriroq — 4,5%, ammo baribir minimal riskli mamlakatlar (5% dan past) guruhida qolmoqda.
🇺🇿 O‘zbekiston uchun risk mukofoti 8,9%ni tashkil etdi. Shunga yaqin ko‘rsatkichlar Turkiya, Armaniston, Nepal va Makedoniyada ham kuzatilmoqda. Shu bilan birga, 🇷🇺Rossiyada bu ko‘rsatkich 8,1%, 🇰🇿Qozog‘istonda esa 6,3% darajasidadir.
📈#рынки#VC
#KBW The Korean Blockchain Week starts today. Meet our partners Heng Lee and Stefano Virgilli @stefanovirgilli to share your funding goals. @DwfLabs is much more than a #web3#VC
CleanSpark Holds 10,000 Bitcoin!
CleanSpark, a publicly traded company, has surpassed 10,000 #Bitcoin in its balance sheet. This significant investment positions them strongly in the cryptocurrency market.
#Bitcoin#Crypto#VC
Crypto Buzz: Bitcoin Reaches $93,000!
Bitcoin surges to $93,000. Jack Mallers dismisses comments from Jeffrey Epstein's former banker regarding Bitcoin's value.
Stay updated for more crypto news!
#Bitcoin#Crypto#VC