TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #61 · 1.07

Посмотрел дебаты Панчина и Редько, где первый топил за вакцинацию, а второй — против конкретно вакцинации от ковида в текущий момент. Панчина я знаю давно (не лично, хотя видел его пару раз), и он говорит непротиворечивые вещи, которые согласуются с моими собственными наблюдениями за тем, как устроен мир. При этом его оппонент держался не слишком уверенно, не обладал стройной речью, говорил сбивчиво и путался, использовал терминологию в стиле «Вы всё врёте» и упомянул, что смотрит Соловьева. Ну и оговорка (?) про «лохокост» тоже очень резанула уши. Для меня исход дебатов очевиден: победа Панчина с большим отрывом Точнее даже фактически дебаты толком не состоялись, потому что хорошей дискуссии я не увидел. Но, если посмотреть объективно, то оппоненты говорили о вещах, в которых я не разбираюсь, и истинность/ложность многих посылов гарантированно подтвердить не могу. То есть чисто гипотетически возможно, что это не тёмный Редько нёс ерунду, а на самом деле языкастый Панчин заговорил всем зубы. Потом я подумал, а существует ли способ, не обучая меня 20 лет на врача, относительно надежно дать мне возможность разобраться, где тут правда? И, пожалуй, ответ нет. Более того — даже обучая, всё равно нет. А проблема тут в том, что люди отрицают даже вполне объективные вещи, если только их нельзя строго научно обосновать. Если можно -- тоже отрицают, но с такими людьми можно ни в какие дебаты не вступать. А вот если не было проведено исследование о том, что вода мокрая, то спуск по дереву абстракции до этого аргумента всё равно не позволит надёжно свой постулат подтвердить и оппоненту и слушателям. А есть исследование, что вода мокрая? Можно ли доверять этому исследованию? А мне знакомый гидролог сказал, что не мокрая. И у моего друга не мокрая. И вообще, вы же понимаете, лёд это тоже вода, а он не совсем мокрый. Я это на своей сфере остро чувствую. В чатах разработчиков, допустим, теоретически все являются компетентными специалистами, а по факту всё равно всерьёз возникают заявления о том, что, например, система типов в JavaScript -- логичная и предсказуемая, что абстрактные классы не нужны, что не обязательно ставить пробелы вокруг операторов, что отсутствие array-helper'ов в Go это благо и так далее. Впрочем, в комментариях под дебатами на ютубе справедливо раскритиковали, что ведущей следовало сделать хотя бы минимальный факт-чекинг по результатам. А то дебатирующие просто обвиняли друг друга во лжи, и в общем случае произвольному слушателю надёжно понять, кто из них прав, было нельзя. #life

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #frontiermath

当前筛选 #frontiermath清除筛选
Venture Village Wall 🦄

@venturevillagewall · Post #3607 · 20.12.2024 г., 19:00

o3 & o3-mini Break Benchmark Records The performance of o3 and o3-mini showcases state-of-the-art (SOTA) results across various benchmarks. Key insights include: - Frontier Math scores increased from 2% to 25%. - SWE-Bench achieved 71.7%, a significant leap for a startup that recently raised $200 million with 13.86% earlier this year. - ELO on Codeforces reached 2727, held by only 150 individuals globally. - ARC-AGI model scored 87.5%, breaking a five-year deadlock. - Noteworthy progress on GPQA and AIME benchmarks. Access to o3-mini is currently available to security researchers, while general public access is set for late January. Full access to o3 will follow later. #AI#SOTA#Benchmarks#o3#o3-mini #FrontierMath#SWE-Bench #Codeforces#ELO#ARC-AGI #GPQA#AIME#Funding#Progress#Research#Technology#Innovation

Venture Village Wall 🦄

@venturevillagewall · Post #3606 · 20.12.2024 г., 18:41

O3 and O3-Mini Benchmark Breakthroughs The O3 and O3-Mini models showcase state-of-the-art (SOTA) performance with significant leaps in various benchmarks. Results on Frontier Math have jumped from 2% to 25%. The SWE-Bench model achieved a score of 71.7%, while a startup has raised $200 million following results of 13.86%. ELO on Codeforces reached 2727, surpassing most peers globally. Notably, the ARC-AGI model scored 87.5%, breaking a five-year benchmark. Access for security researchers to O3-Mini starts today, with general access available in late January. #O3#O3Mini#SOTA#Benchmarks#AI#ML#Funding#Codeforces#ARC-AGI #FrontierMath#SWE-Bench #ELO#GPQA#AIME#SecurityResearch#TechUpdates#Innovations#Startups#Performance#AIModels