TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #1012 · 20.08

Зимой СМИ писали, что за полгода спрос на умные колонки в России вырос в 1.5 раза. Девайс всё сильнее проникает в народ, и это приятно. Одна из самых интересных и меняющих жизнь технологий лично для меня за всё новое время. Сильнее и значительнее, чем эти ваши генеративки, во всяком случае пока. В детстве я смотрел фантастические фильмы, где герой разговаривает с ИИ, встроенным в дом, автомобиль, космический корабль, просит его открывать двери, отвечать на вопросы и так далее. Мечтал, что когда-то тоже так буду, и вот оно уже почти. Сегодня половину всех операций со светом выполняю голосом, практически перед каждым выходом узнаю погоду, иногда прошу что-нибудь подсказать, активно использую таймеры и отложенное выполнение. Утром захожу в кабинет и командую Алисе запустить рабочий режим: закрываются шторы, включаются два системных блока, выключается свет, если он был — чем не фантастика? В квартире в общей сложности семь Станций разного формата, даже в ванной поставил: удобно слушать музыку или аудиокнижку, пока купаешься, спрашивать время и так далее. Никаким другим адекватным образом с мокрыми мыльными руками устройством не поуправлять. Да, параноики любят кричать про Большого Брата, и это конечно очень смешно. Ведь без всяких устройств всё равно за нами наблюдают инопланетяне из космоса, воздействуя своими лучами на разумы, чтобы мы не догадались, что Земля плоская. На даче, в гостях, в отеле в командировке я периодически ощущаю недостаток всех этих возможностей. Бывало, что обращаюсь к Алисе по привычке, а её и нет. Хотя друзья всё чаще уже ставят и себе тоже. Тут во всю проявляются недостатки: если ты не знаешь, как у конкретного друга называется комната или светильник, не знаешь его сценарии, то и управлять не сможешь. Всё-таки даже с подключением YaGPT это не стало полноценным машинным разумом с памятью, контекстом, умением принимать решения. Ждём, думаю, застанем. #gadgets

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #gpqa

当前筛选 #gpqa清除筛选
Venture Village Wall 🦄

@venturevillagewall · Post #3607 · 20.12.2024 г., 19:00

o3 & o3-mini Break Benchmark Records The performance of o3 and o3-mini showcases state-of-the-art (SOTA) results across various benchmarks. Key insights include: - Frontier Math scores increased from 2% to 25%. - SWE-Bench achieved 71.7%, a significant leap for a startup that recently raised $200 million with 13.86% earlier this year. - ELO on Codeforces reached 2727, held by only 150 individuals globally. - ARC-AGI model scored 87.5%, breaking a five-year deadlock. - Noteworthy progress on GPQA and AIME benchmarks. Access to o3-mini is currently available to security researchers, while general public access is set for late January. Full access to o3 will follow later. #AI#SOTA#Benchmarks#o3#o3-mini #FrontierMath#SWE-Bench #Codeforces#ELO#ARC-AGI #GPQA#AIME#Funding#Progress#Research#Technology#Innovation

Venture Village Wall 🦄

@venturevillagewall · Post #3606 · 20.12.2024 г., 18:41

O3 and O3-Mini Benchmark Breakthroughs The O3 and O3-Mini models showcase state-of-the-art (SOTA) performance with significant leaps in various benchmarks. Results on Frontier Math have jumped from 2% to 25%. The SWE-Bench model achieved a score of 71.7%, while a startup has raised $200 million following results of 13.86%. ELO on Codeforces reached 2727, surpassing most peers globally. Notably, the ARC-AGI model scored 87.5%, breaking a five-year benchmark. Access for security researchers to O3-Mini starts today, with general access available in late January. #O3#O3Mini#SOTA#Benchmarks#AI#ML#Funding#Codeforces#ARC-AGI #FrontierMath#SWE-Bench #ELO#GPQA#AIME#SecurityResearch#TechUpdates#Innovations#Startups#Performance#AIModels