TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #397 · 23.06

Яндекс выложил в открытый доступ нейросеть YaLM 100B, которая может псевдоразумно отвечать на вопросы и вести беседу. К сожалению, попробовать её лично я не могу, потому что для запуска нужно около 200+ гигабайт видеопамяти, это приличная такая майнинг-ферма. Но по скриншотам она действительно хорошо работает. Хотя про GPT-3 тоже так говорили, а на деле очень так себе. А ещё неделю назад по сети ходила новость о том, что один из разработчиков в Google пообщался с их нейросетью и увидел в ней признаки разума. Вплоть до того, что нанял юриста защищать интересы нейросети! Его в итоге отправили в оплачиваемый принудительный отпуск, подлечиться, наверное. Разработчики знают о мысленном эксперименте "Китайская комната", но обывателю он, на мой взгляд, сложен для понимания, поэтому я попробую привести другой пример. Представьте, что у вас есть кубики с буквами, и там набор граней, которые составляют фразу "Привет, человек". Вы эти грани намазали чем-то вкусным и научили вашу собаку переворачивать кубики вкусными гранями вверх в ответ на команду "Привет, собака". В итоге, если вы говорите "Привет, собака", она переворачивает кубики так, чтобы из них сложилось "Привет, человек". Научилась ли собака при этом говорить на человеческом языке и осознанно отвечать на приветствие? Нет. Нейросеть гораздо глупее собаки (та хотя бы способна именно сознанием различать разные человеческие фразы). Это просто набор алгоритмов, которые складывают кубики, а мы уже на этих кубиках что-то читаем. Чтобы кубики складывались правильно, этих алгоритмов много, и параметров, которыми такая нейросеть оперирует, 100 миллиардов. Даже очень хороший алгоритм по подбору кубиков не является разумным фактически ни в каком смысле этого слова. Впрочем, это не значит, что он не может решать нужные нам задачи. Такую сетку вполне нормально поставить в условной службе поддержки отбиваться от дурачков, задающих банальные или глупые вопросы. Что еще посмотреть по теме: «Теорема о бесконечном количестве обезъян»; И очень крутой фантастический рассказ Хорхе Луиса Борхеса «Вавилонская библиотека». В Библиотеке точно будет книга, которая станет буквально с вами разговаривать: вы задаёте вопрос (любой), переворачиваете страницу и видите там ответ на него, будто бы от разумного существа. #dev#fiction

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #o3

当前筛选 #o3清除筛选

⚡️ OpenAI o3-mini — ya está disponible gratis en ChatGPT OpenAI ha lanzado al público general su modelo o3-mini, anunciado a finales del año pasado. Características clave: 🔜El modelo se presenta en dos versiones: o3-mini, con un rendimiento similar al de o1 pero a menor costo, y o3-mini-high, que supera a todos los modelos actuales de OpenAI. 🔜Puedes probar o3-mini de forma gratuita. Con la suscripción Plus tienes acceso a 150 solicitudes al día, y con la suscripción Pro, acceso ilimitado tanto a o3-mini como a o3-mini-high. 🔜o3-mini resuelve entre el 92% y el 93% de las tareas de entrevistas para el puesto de ingeniero investigador en OpenAI, mientras que o1 alcanza un máximo del 83% ⤴️ 🔜 o3-mini es más rápida que los modelos anteriores, especialmente en programación. Además, genera menos alucinaciones al hablar sobre personas y se comunica mucho mejor en otros idiomas además del inglés. 🔜 El modelo es más seguro, menos sesgado y está mejor protegido contra los "jailbreaks" que las versiones anteriores. "En otras palabras, es rápido, económico, inteligente y diseñado para aplastar a DeepSeek", escribe Wired sobre o3-mini. 🔴 OpenAI o3-mini ya está disponible en@GPT4Telegrambot. Incluido en el paquete "ChatGPT + DALL-E 3". #OpenAI#o3#ChatGPT@hiaimediaes

💻 OpenAI presentó una nueva generación de modelos de razonamiento: o3 El CEO de OpenAI, Sam Altman, anunció el nuevo modelo de razonamiento o3 y su versión más pequeña, o3-mini. Las principales ventajas de o3 son: ➡️ o3 escribe código casi al nivel de los desarrolladores de OpenAI. El modelo principal supera a o1 en programación en un factor de aproximadamente 1.5. ➡️ Resuelve tareas a nivel de doctorado un 10% mejor que o1. ➡️ En el benchmark de razonamiento ARC AGI, o3 obtiene una puntuación del 87.5%, superando a los humanos. El resultado de o3-mini es del 76%. La generación anterior, o1, apenas superaba el 30%, y las redes neuronales regulares alcanzaban alrededor del 5%. Más detalles en los gráficos⤴️ 💡 La versión ligera o3-mini estará disponible en tres variantes, que se diferencian en la profundidad del razonamiento. El o3-mini-low está aproximadamente entre el o1 y el o1-mini, mientras que el o3-mini-high supera al o1. "o3 es un modelo muy, muy inteligente, y o3-mini es un modelo increíblemente inteligente pero con un rendimiento y costo realmente buenos", según Altman. Los modelos aún no están disponibles para los usuarios. OpenAI está aceptando solicitudes para pruebas de seguridad. Este fue el último de los 12 regalos de "shipmas" de OpenAI. Lo más interesante: ➡️Versión completa de OpenAI o1 y suscripción Pro por $200 al mes ➡️Generador de videos Sora ➡️Modo video para ChatGPT ➡️Búsqueda web en ChatGPT ➡️ChatGPT en WhatsApp ¿Qué opinas del maratón? ❤️ — ¡Es genial, muchas novedades! 🎃 — Espera, ¿dónde está el GPT-4.5?!?! #noticias#OpenAI#ChatGPT#o3@hiaimediaes

Venture Village Wall 🦄

@venturevillagewall · Post #3607 · 20.12.2024 г., 19:00

o3 & o3-mini Break Benchmark Records The performance of o3 and o3-mini showcases state-of-the-art (SOTA) results across various benchmarks. Key insights include: - Frontier Math scores increased from 2% to 25%. - SWE-Bench achieved 71.7%, a significant leap for a startup that recently raised $200 million with 13.86% earlier this year. - ELO on Codeforces reached 2727, held by only 150 individuals globally. - ARC-AGI model scored 87.5%, breaking a five-year deadlock. - Noteworthy progress on GPQA and AIME benchmarks. Access to o3-mini is currently available to security researchers, while general public access is set for late January. Full access to o3 will follow later. #AI#SOTA#Benchmarks#o3#o3-mini #FrontierMath#SWE-Bench #Codeforces#ELO#ARC-AGI #GPQA#AIME#Funding#Progress#Research#Technology#Innovation

Venture Village Wall 🦄

@venturevillagewall · Post #3606 · 20.12.2024 г., 18:41

O3 and O3-Mini Benchmark Breakthroughs The O3 and O3-Mini models showcase state-of-the-art (SOTA) performance with significant leaps in various benchmarks. Results on Frontier Math have jumped from 2% to 25%. The SWE-Bench model achieved a score of 71.7%, while a startup has raised $200 million following results of 13.86%. ELO on Codeforces reached 2727, surpassing most peers globally. Notably, the ARC-AGI model scored 87.5%, breaking a five-year benchmark. Access for security researchers to O3-Mini starts today, with general access available in late January. #O3#O3Mini#SOTA#Benchmarks#AI#ML#Funding#Codeforces#ARC-AGI #FrontierMath#SWE-Bench #ELO#GPQA#AIME#SecurityResearch#TechUpdates#Innovations#Startups#Performance#AIModels