TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #704 · 17.12

Я всегда был уверен, что системы рекомендаций работают так плохо, потому что это слишком сложная задача. Владельцы площадок бьются с алгоритмами, машинным обучением, деревьями решений и взвешенными суммами, но получается всё равно херня, и человеку могут рекомендовать нерелевантный бред (и, что ещё хуже — не рекомендовать интересный для него контент). Кажется, хорошо работают только рекомендации на Ютубе, но этому есть объяснение: контент на Ютубе более длительный и дорогой. Его сложнее производить, он выходит реже. Качественный ролик на Ютубе не будет говном практически независимо от темы, на которую он снят. А ещё меньшее число объёмных роликов проще кластеризовать и можно предлагать пользователю в небольших количествах. Но если мы откроем YouTube Shorts (это очередной аналог тиктока с короткими вертикальными видео), то заметим, что качество рекомендаций упало сразу на два порядка: какие-то тупые попсовые шутки, "удивительные" факты из жизни, завлекающие отрывки из фильмов "код смотри в телеграм-канале", озвучка анекдотов и прочий мусор. Алгоритмы уже совсем не справляются с тем, чтобы предложить что-то годное, не говоря уже о релевантности конкретно мне, хотя история моих просмотров и вкусов Ютубу, очевидно, известна. Тем не менее, иногда разработчики могут не только не уметь, но и не хотеть писать нормальные рекомендации. Вот ВК предложил мне BadComedian в блоке "Интересные авторы". Оставим в стороне, что Бэдкомендиан это ютубер, и у него в ВК в лучшем случае будут репосты ссылок на Ютуб. Но мне предлагают не паблик, а личную страницу.... на которой не было записей с сентября 2021 года. Нет совершенно никакого смысла быть подписанным на личную страницу Бэдкомедиана сейчас. Кажется, единственный критерий, на котором основывались эти рекомендации: общее число подписчиков. Как должны работать рекомендации на самом деле? Алгоритмически я бы оценивал частоту постов (кстати, чрезмерно частые это тоже плохо, должно работать в минус), оценивал бы, является пост просто публикацией внешней ссылки на другой ресурс, является ли репостом паблика, и смотрел бы, сколько прошло времени с последней записи на странице автора. Наверное, в качестве коэффициента с небольшим весом можно добавить ещё объём контента в посте и активность людей (лайки + комментарии). Причём, делается это достаточно просто, никакой ML не нужен. Даже такая оценка, не берущая в расчёт тематику страницы, всё равно лучше, чем "Просто покажем людей, на которых когда-то подписалось куча народу, и им до сих пор лень отписаться после прекращения активности автора". По крайней мере теперь меня не удивляет, что хвалёные Клипы постоянно подсовывают мне какой-то подростковый шлак вместо крутых видео с полётами на FPV-квадрокоптерах. YouTube Shorts по крайней мере пару раз такие вещи предлагал, а вот Клипы вообще ни разу (станицу Клипов я не открываю, разумеется, но в ленте новостей встречаются блоки с автовоспроизведением). Кстати, на скрине есть второй автор — Стас "Ай как просто". Его банят на Ютубе за критику западной модели текущих событий, и он пишет: "Буду создавать каналы-однодневки, куда деваться". То есть у него даже мысли не возникает, что какая-то ещё площадка может служить его целям. Ну с таким отношением других площадок к рекомендациям — понятно. #web

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #o3

当前筛选 #o3清除筛选

⚡️ OpenAI o3-mini — ya está disponible gratis en ChatGPT OpenAI ha lanzado al público general su modelo o3-mini, anunciado a finales del año pasado. Características clave: 🔜El modelo se presenta en dos versiones: o3-mini, con un rendimiento similar al de o1 pero a menor costo, y o3-mini-high, que supera a todos los modelos actuales de OpenAI. 🔜Puedes probar o3-mini de forma gratuita. Con la suscripción Plus tienes acceso a 150 solicitudes al día, y con la suscripción Pro, acceso ilimitado tanto a o3-mini como a o3-mini-high. 🔜o3-mini resuelve entre el 92% y el 93% de las tareas de entrevistas para el puesto de ingeniero investigador en OpenAI, mientras que o1 alcanza un máximo del 83% ⤴️ 🔜 o3-mini es más rápida que los modelos anteriores, especialmente en programación. Además, genera menos alucinaciones al hablar sobre personas y se comunica mucho mejor en otros idiomas además del inglés. 🔜 El modelo es más seguro, menos sesgado y está mejor protegido contra los "jailbreaks" que las versiones anteriores. "En otras palabras, es rápido, económico, inteligente y diseñado para aplastar a DeepSeek", escribe Wired sobre o3-mini. 🔴 OpenAI o3-mini ya está disponible en@GPT4Telegrambot. Incluido en el paquete "ChatGPT + DALL-E 3". #OpenAI#o3#ChatGPT@hiaimediaes

💻 OpenAI presentó una nueva generación de modelos de razonamiento: o3 El CEO de OpenAI, Sam Altman, anunció el nuevo modelo de razonamiento o3 y su versión más pequeña, o3-mini. Las principales ventajas de o3 son: ➡️ o3 escribe código casi al nivel de los desarrolladores de OpenAI. El modelo principal supera a o1 en programación en un factor de aproximadamente 1.5. ➡️ Resuelve tareas a nivel de doctorado un 10% mejor que o1. ➡️ En el benchmark de razonamiento ARC AGI, o3 obtiene una puntuación del 87.5%, superando a los humanos. El resultado de o3-mini es del 76%. La generación anterior, o1, apenas superaba el 30%, y las redes neuronales regulares alcanzaban alrededor del 5%. Más detalles en los gráficos⤴️ 💡 La versión ligera o3-mini estará disponible en tres variantes, que se diferencian en la profundidad del razonamiento. El o3-mini-low está aproximadamente entre el o1 y el o1-mini, mientras que el o3-mini-high supera al o1. "o3 es un modelo muy, muy inteligente, y o3-mini es un modelo increíblemente inteligente pero con un rendimiento y costo realmente buenos", según Altman. Los modelos aún no están disponibles para los usuarios. OpenAI está aceptando solicitudes para pruebas de seguridad. Este fue el último de los 12 regalos de "shipmas" de OpenAI. Lo más interesante: ➡️Versión completa de OpenAI o1 y suscripción Pro por $200 al mes ➡️Generador de videos Sora ➡️Modo video para ChatGPT ➡️Búsqueda web en ChatGPT ➡️ChatGPT en WhatsApp ¿Qué opinas del maratón? ❤️ — ¡Es genial, muchas novedades! 🎃 — Espera, ¿dónde está el GPT-4.5?!?! #noticias#OpenAI#ChatGPT#o3@hiaimediaes

Venture Village Wall 🦄

@venturevillagewall · Post #3607 · 20.12.2024 г., 19:00

o3 & o3-mini Break Benchmark Records The performance of o3 and o3-mini showcases state-of-the-art (SOTA) results across various benchmarks. Key insights include: - Frontier Math scores increased from 2% to 25%. - SWE-Bench achieved 71.7%, a significant leap for a startup that recently raised $200 million with 13.86% earlier this year. - ELO on Codeforces reached 2727, held by only 150 individuals globally. - ARC-AGI model scored 87.5%, breaking a five-year deadlock. - Noteworthy progress on GPQA and AIME benchmarks. Access to o3-mini is currently available to security researchers, while general public access is set for late January. Full access to o3 will follow later. #AI#SOTA#Benchmarks#o3#o3-mini #FrontierMath#SWE-Bench #Codeforces#ELO#ARC-AGI #GPQA#AIME#Funding#Progress#Research#Technology#Innovation

Venture Village Wall 🦄

@venturevillagewall · Post #3606 · 20.12.2024 г., 18:41

O3 and O3-Mini Benchmark Breakthroughs The O3 and O3-Mini models showcase state-of-the-art (SOTA) performance with significant leaps in various benchmarks. Results on Frontier Math have jumped from 2% to 25%. The SWE-Bench model achieved a score of 71.7%, while a startup has raised $200 million following results of 13.86%. ELO on Codeforces reached 2727, surpassing most peers globally. Notably, the ARC-AGI model scored 87.5%, breaking a five-year benchmark. Access for security researchers to O3-Mini starts today, with general access available in late January. #O3#O3Mini#SOTA#Benchmarks#AI#ML#Funding#Codeforces#ARC-AGI #FrontierMath#SWE-Bench #ELO#GPQA#AIME#SecurityResearch#TechUpdates#Innovations#Startups#Performance#AIModels