Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе.
У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи.
Вот как это может выглядеть:
1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое.
2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое
3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое
4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98"
...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать.
И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт:
"Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки).
Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы.
Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый.
#dev
🇸🇪Национальная библиотека создала наиболее точную модель преобразования речи в текст на шведском языке
Национальная библиотека Швеции разработала инновационную шведскую модель искусственного интеллекта, преобразующую речь в текст.
Модель, получившая название KB-Whisper, на 47% точнее преобразует речь в текст на шведском языке, чем американский оригинал, разработанный исследовательской организацией в области искусственного интеллекта Open AI.
Леонора Вестербака — старший специалист по обработке данных, возглавлявшая проект, утверждает, что модель представляет большую ценность, поскольку она охватывает гораздо более широкий спектр различных диалектов и акцентов Швеции.
Источник
📸 KB / Lina Löfström Baker
#swe
🇸🇪5 странных шведских рождественских блюд, которые стоит попробовать только самым смелым
Во время рождественских застолий (Julbord) в Швеции иностранцы могут столкнуться с довольно необычными традиционными блюдами.
Вот пять самых странных рождественских угощений, к которым лучше подготовиться заранее:
1. Яичный сыр (Äggost)
Это блюдо из западной Швеции, региона Бохуслен, представляет собой смесь свернувшегося молока и яиц, которая затем заливается в форму и приобретает желеобразную текстуру.
Его подают с селедкой или вареньем, на выбор. Это напоминает о временах, когда не было холодильников, и приходилось изобретать способы хранения продуктов.
2. «Окунуть в горшок» (Dopp i Grytan)
Это способ насладиться остатками от рождественской ветчины. В шведской традиции ломтики хлеба окунают в бульон, оставшийся от варки ветчины.
3. Mumma
Этот крепкий рождественский коктейль включает в себя четыре вида алкоголя: портер, лагер, джин и портвейн. Популярный в 1500-х годах, а затем вновь получивший знаменитость в 1900-х, это напиток до сих пор можно найти в магазинах Systembolaget.
Если захотите приготовить его дома, смешайте по чашке портера, лагера и газировки с 4 мл джина и 4 мл портвейна. Будьте осторожны — напиток не для слабонервных!
4. Рис а ля Мальта (Ris à la Malta)
Название этого десерта звучит изысканно, но не обманывайтесь — никакого отношения к Мальте он не имеет. Это всего лишь рисовый пудинг, происхождение которого связывают с Данией. Шведы переиначили датское название «Risalamande» в «Ris à la Malta», что сбивает с толку иностранных гостей.
5. Копченая свиная голова (и, иногда, ножки)
Хотя традиция становится все менее популярной, некоторые шведские рождественские столы до сих пор украшают копченой свиной головой. Её часто декорируют и даже подписывают веселыми рождественскими пожеланиями.
Это яркий пример мрачного шведского юмора. А если вам особенно «повезет», вы также можете попробовать желе из свиных ножек (grisfötter).
Источник
📸Scanpix
#swe
🇸🇪В Шведской академии — смена главы после скандального десятилетия
Постоянный секретарь Шведской академии Матс Мальм покидает должность после семи бурных лет, в течение которых ему пришлось восстанавливать имидж учреждения, пережившего один из самых громких кризисов в своей истории.
С 1 июня 2026 года пост займет писательница и журналистка Ингрид Карлберг, став первой женщиной в этой роли после Сары Даниус, ушедшей в отставку на фоне скандала #MeToo.
Мальм, литературовед и профессор, возглавил Академию в 2019 году — вскоре после того, как всплыли обвинения в изнасиловании против Жан-Клода Арно, тесно связанного с академиками. Его жена, поэтесса Катарина Фростенсон, ушла из Академии. За ней последовали еще шесть членов, а вручение Нобелевской премии по литературе было отложено впервые с 1949 года.
Мальму досталась задача по реанимации репутации. Он провёл реорганизацию, привёл новых членов, обновил устав и расширил фокус премии, включая больше авторов за пределами западного мира.
Теперь эстафету принимает Карлберг:
«Эта роль — огромная честь. Я принимаю её с радостью и смирением», — заявила она.
Источник
📸ТТ
#swe
🇮🇸🇫🇮🇸🇪🇩🇰🇳🇴 Определны все представители стран Северной Европы на Евровидении 2025
Во всех странах Северной Европы завершились отборочные этапы и определены участники, которые представят страны на конкурсе Евровидение 2025, который в этом году пройдет в Швейцарии, в городе Базель.
🇳🇴Кайл Алессандро, Норвегия
18-летний Кайл Алессандро выиграл Melodi Grand Prix 2024 с песней Lighter.
Певец из Стейнхьера уже участвовал в MGP в 2023 году как часть группы Umami Tsunami.
Песня Lighter глубоко личная для Кайла — она вдохновлена борьбой его матери с раком и несет в себе послание стойкости и надежды. Строка “I’ll be my own lighter” символизирует внутреннюю силу в трудные времена.
🇫🇮 Эрика Викман, Финляндия
Эрика Викман представит Финляндию с песней Ich Komme. Песня включает в себя слова на немецком и финском языках. Текст вызвал противоречивую реакцию зрителей.
Эрике Викман 32 года, она является уроженкой города Тампере. Пять лет назад она уже принимала участие в отборах на Евровидение.
🇮🇸 Væb, Исландия
Победу в национальном отборе Исландии одержал музыкальный дуэт Væb, образованный в 2022 году. В его состав входят братья, певцы и рэперы Маттиас Давид и Хаульфдан Хельги Маттиассон. Они представят Исландию с песней Róa.
🇩🇰🇫🇴 Сиссаль, Дания
Сиссаль Йоанна Нордберг Никласен родилась в феврале 1995 года на Фарерских островах. Она представит Данию на конкурсе с песней Hallucination.
Сиссаль получила широкую известность в 2005 году, когда победила в фарерском детском песенном конкурсе Nósa Barnaprix с песней Summarið er komið.
🇸🇪 KAJ, Швеция
Kaj - музыкальная и комедийная группа из Вёро, Остроботния, Финляндия. KAJ выиграли Melodifestivalen с песней Bara bada bastu.
Группа принадлежит к финно-шведской культурной среде и преимущественно выступает на шведском языке, используя диалект Вёро. В состав входят Кевин Холмстрём, Аксель Охман и Якоб Норргорд, первые буквы их имён образуют название группы.
Музыка KAJ охватывает множество жанров, включая поп, рок, рэп, диско и шлягер, часто с элементами юмора и сатиры. У группы также есть сатирический рокабилли-альтер эго Vörjeans, пародирующий субкультуру raggare.
#nor#fin#swe#den#isl
🇫🇮🇩🇰🇳🇴🇸🇪🇮🇸Финляндия снова признана самой счастливой страной мира — Дания на втором месте
Финляндия восьмой год подряд возглавила рейтинг самых счастливых стран мира, согласно Всемирному докладу о счастье, опубликованному исследователями из Оксфорда на основе данных Gallup.
С оценкой 7,7 из 10, Финляндия вновь обошла Данию, которая уверенно удерживает второе место с результатом 7,5. Это немного больший разрыв, чем в прошлом году.
В топ-5 также вошли:
– Исландия
– Швеция
– Нидерланды
Норвегия заняла седьмое место, а в десятку впервые попали Коста-Рика и Мексика.
Великобритания оказалась на 23 месте, а США опустились на 24-е — их самый низкий результат за всё время.
📊 В опросе участвовали 147 стран, по 1000 человек от каждой. Доклад публикуется с 2012 года и учитывает ВВП, уровень жизни, продолжительность жизни, восприятие свободы, коррупции и доброжелательность общества.
Источник
📸Unsplash
#fin#swe#den#nor#is
🇫🇮🇸🇪🇩🇰🇳🇴🇮🇸🇦🇽🇫🇴🇬🇱 Сегодня день зимнего солнцестояния
21 декабря в Северном полушарии фиксируется самый короткий световой день в году - день зимнего солнцестояния.
В Хельсинки день длится 5ч 49 мин, в Осло - 5ч 54 мин, в Стокгольме - 6ч 05 мин. В Копенгагене световой день - дольше всех из столиц стран Северной Европы - 7ч 1 мин. В Рейкьявике - меньше всех: всего 4ч 7 мин.
Вопреки представлениям, в столице Лапландии, финском Рованиеми, солнце находилось над горизонтом 2ч 16 мин. Там классической полярной ночи нет в течении всего года.
Уже завтра световой день начнёт постепенно удлиняться. Да будет свет! ☀️
🇫🇮 Talvipäivänseisaus
🇩🇰 Vintersolhverv
🇳🇴 Vintersolverv
🇮🇸 Vetrarsólstöður
🇸🇪 Vintersolståndet
🇬🇱 Siqiniup utiriarninga ukiuq
🇫🇴 Vetrarsólstøða
🏳️ Dálviáigejorggáldat (саамский)
📸 Suomen luonto
NNN - Nordic. News. Norppa.
#fin#isl#swe#den#nor#gre#far#ax
o3 & o3-mini Break Benchmark Records
The performance of o3 and o3-mini showcases state-of-the-art (SOTA) results across various benchmarks. Key insights include:
- Frontier Math scores increased from 2% to 25%.
- SWE-Bench achieved 71.7%, a significant leap for a startup that recently raised $200 million with 13.86% earlier this year.
- ELO on Codeforces reached 2727, held by only 150 individuals globally.
- ARC-AGI model scored 87.5%, breaking a five-year deadlock.
- Noteworthy progress on GPQA and AIME benchmarks.
Access to o3-mini is currently available to security researchers, while general public access is set for late January. Full access to o3 will follow later.
#AI#SOTA#Benchmarks#o3#o3-mini #FrontierMath#SWE-Bench #Codeforces#ELO#ARC-AGI #GPQA#AIME#Funding#Progress#Research#Technology#Innovation
O3 and O3-Mini Benchmark Breakthroughs
The O3 and O3-Mini models showcase state-of-the-art (SOTA) performance with significant leaps in various benchmarks. Results on Frontier Math have jumped from 2% to 25%. The SWE-Bench model achieved a score of 71.7%, while a startup has raised $200 million following results of 13.86%. ELO on Codeforces reached 2727, surpassing most peers globally. Notably, the ARC-AGI model scored 87.5%, breaking a five-year benchmark. Access for security researchers to O3-Mini starts today, with general access available in late January.
#O3#O3Mini#SOTA#Benchmarks#AI#ML#Funding#Codeforces#ARC-AGI #FrontierMath#SWE-Bench #ELO#GPQA#AIME#SecurityResearch#TechUpdates#Innovations#Startups#Performance#AIModels