TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #358 · 26.05

Интересная настольная игра для вечеринок "Опасные Слова". В этой игре классически нужно объяснять слово своей команде, по аналогии с тем, как это делается в "Шляпе" ("Alias"). Но есть важное дополнение. Допустим, вам попалось слово "меч". Команда противника тоже знает, что у вас за слово. И она составляет список слов-ловушек, пытаясь угадать, какие слова вы можете захотеть сказать при объяснении слова меч. Вам эти слова нельзя будет произносить, иначе объяснение не засчитывается. Вы этот список сами не видите, просто знаете, что он есть. Таким образом, вы не можете заведомо исключить конкретные слова из вашего объяснения, но должны по возможности стараться не говорить всё, что вообще относится к "мечу". И вот здесь основная фишка этой игры. Как объяснить "колесо", не говоря ничего про круглое, транспорт, езду, шины итд? Через несколько раундов оказывается, что "колесо" это что-то из топологии, "носорог" это толстый аналог сказочной лошади, а "жираф" это нечто, что упоминается при описании возвратного гортанного нерва. Заставляет очень много и нестандартно думать. Формально до 8 игроков, но по факту можно играть хоть большой толпой. Категорически рекомендую. Если не найдёте, где купить (сейчас что-то с поставками туго), то можете просто скачать правила: для игры на самом деле нужен случайный источник слов и листочки с карандашами. #games

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #frontiermath

当前筛选 #frontiermath清除筛选
Venture Village Wall 🦄

@venturevillagewall · Post #3607 · 20.12.2024 г., 19:00

o3 & o3-mini Break Benchmark Records The performance of o3 and o3-mini showcases state-of-the-art (SOTA) results across various benchmarks. Key insights include: - Frontier Math scores increased from 2% to 25%. - SWE-Bench achieved 71.7%, a significant leap for a startup that recently raised $200 million with 13.86% earlier this year. - ELO on Codeforces reached 2727, held by only 150 individuals globally. - ARC-AGI model scored 87.5%, breaking a five-year deadlock. - Noteworthy progress on GPQA and AIME benchmarks. Access to o3-mini is currently available to security researchers, while general public access is set for late January. Full access to o3 will follow later. #AI#SOTA#Benchmarks#o3#o3-mini #FrontierMath#SWE-Bench #Codeforces#ELO#ARC-AGI #GPQA#AIME#Funding#Progress#Research#Technology#Innovation

Venture Village Wall 🦄

@venturevillagewall · Post #3606 · 20.12.2024 г., 18:41

O3 and O3-Mini Benchmark Breakthroughs The O3 and O3-Mini models showcase state-of-the-art (SOTA) performance with significant leaps in various benchmarks. Results on Frontier Math have jumped from 2% to 25%. The SWE-Bench model achieved a score of 71.7%, while a startup has raised $200 million following results of 13.86%. ELO on Codeforces reached 2727, surpassing most peers globally. Notably, the ARC-AGI model scored 87.5%, breaking a five-year benchmark. Access for security researchers to O3-Mini starts today, with general access available in late January. #O3#O3Mini#SOTA#Benchmarks#AI#ML#Funding#Codeforces#ARC-AGI #FrontierMath#SWE-Bench #ELO#GPQA#AIME#SecurityResearch#TechUpdates#Innovations#Startups#Performance#AIModels