@besnow_cloud · Post #2783 · 01.02.2025 г., 08:13
Sam Altman预告:o3-mini还有大招即将登场——他暗示“最好留到最后”!这是否意味着AI领域又将迎来颠覆性突破?#AI#o3mini#科技创新https://x.com/sama/status/1885601623625331162
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #1083 · 8.04
Ух, очень продуктивная была поездка. Наши взяли золото, причём, в этом году организаторы решили наградить в том числе экспертов по подготовке, чьи команды выиграли. Не надеялся я, что когда-нибудь ещё раз (после победы в 2022) поднимусь на эту сцену и получу медаль, а оно вот как сложилось. Наверное, по эмоциям от AtomSkills один из самых сильных эффектов. С ним соперничают, разве что, мой первый хакатон VK Hack 2018, и крупнейший в мире хакатон «Цифровой Прорыв», сильно изменивший мою последующую жизнь. В любом случае, каждый год AtomSkills это очень масштабное и классно срежиссированное мероприятие с большим количеством впечатлений, интереса, опыта. А сейчас вот был юбилейный чемпионат — десятый, и такой подгон. Два года не брали медалей, и никогда раньше в нашей компетенции не награждали тех, кто привёз команды. Видимо, мои хакатонные боги-покровители решили, что я засиделся. В задание тоже удалось привнести некоторую новизну. В целом схема такая: эксперты совместно делают задание, придумывают шкалу оценки и критерии. Но при проверке решений каждую команду смотрят только те, кто к этой команде не имеет отношения. При этом критерии оценки это в большинстве своём объективные предикаты, на которые решение проверяется. Например, в критериях может быть фраза «Система позволяет создать нового пользователя: да (3 очка) / нет (0 очков)». Де-факто споров почти не возникает, коллегия экспертов почти всегда сразу видит и понимает, засчитывается тот или иной критерий или нет. Субъективные части в оценке тоже есть, но их влияние на результат в разы меньше, чем в обычных хакатонах. И да, важнейшее ключевое отличие: на AtomSkills решение каждой команды обязательно разворачивается независимо на пустом компьютере и прогоняется через бизнес-сценарии. Нельзя наврать в презентации, будто бы ты что-то сделал, чего нет. Нельзя сделать решение на моках или фейковое. Нельзя вытащить только на харизме и софт-скиллах. В этом году мы, как авторы задания, к обычной энтерпрайз-части добавили алгоритмическую задачу. Стандартно командам предлагается сделать мини-CRM или нечто подобное в заданном домене, что увеличивает влияние заготовок. Если принести с собой слишком много подготовленных форм, CRUD'ов, конфигов и так далее, это экономит тебе много времени, и ты в итоге просто выигрываешь из-за форы. Сейчас же в мини-CRM была специальная функция: написать алгоритм оптимизации расписания работ. Детали задачи я расскажу завтра, но в целом никакие заготовки не помогали решить это эффективно, если не знать задачу заранее (а она до конкурса скрыта, и разглашение карается дисквалификацией). В итоге лично на мой взгляд итоговый балл получился очень взвешенным: — Если команда сделала хороший алгоритм и не провалилась при этом по обычной не-алгоритмической части, она набирала много баллов (как наши) — Если команда сделала неэффективный, но работоспособный алгоритм, у неё был шанс вывезти за счёт супер идеального вылизанного исполнения не-алгоритмической работы (такие получили серебро и бронзу) — Если алгоритм у команды не заработал вообще, то даже при супер идеальном остальном решении в тройку она не попала — Если алгоритм у команды был хороший, но имелся сильный провал во всём остальном — она вообще оказывалась ниже середины В общем, не знаю, попаду ли в следующий раз, но воспоминания и опыт невероятные. #dev
Hashtags
Търсене: #o3mini
@besnow_cloud · Post #2783 · 01.02.2025 г., 08:13
Sam Altman预告:o3-mini还有大招即将登场——他暗示“最好留到最后”!这是否意味着AI领域又将迎来颠覆性突破?#AI#o3mini#科技创新https://x.com/sama/status/1885601623625331162
@kunuzai · Post #39 · 02.02.2025 г., 13:45
🧬O3-mini yordamida o‘zingiz haqingizda ko‘proq bilib oling! Ko‘pchilik ChatGPT faqat bitta suhbat doirasida ma’lumotni eslab qoladi deb o‘ylaydi. Aslida esa unday emas! ChatGPT barcha suhbatlaringizni tahlil qilib, siz haqingizda umumiy xulosa chiqarishi mumkin. Hatto o‘zingiz haqingizda ko‘z ochuvchi fikrlar berishi ham ehtimoldan holi emas. Bunga qanday erishish mumkin? To‘g‘ri yo‘naltirilgan so‘rovlar (promptlar) bilan! 1️⃣ Hayot tarzingiz asosida vizual tasvir 🎨 So‘rov (prompt): «Sen – psixolog-illustrator :: Barcha suhbatlarimni tahlil qilib, mening qiziqishlarim, hayot tarzim va xarakterim aks etgan tasvir chiz :: Rasm detalizatsiyalangan, hissiyotlarga boy va yorqin bo‘lsin» Natija: ChatGPT sizning qiziqishlaringiz, turmush tarzlaringiz va xarakteringizni aks ettiruvchi tasvir yaratadi. Bundan tashqari, har bir detalning nima uchun aynan shu yerda joylashganini so‘rashingiz mumkin – bu o‘zingiz haqingizda ko‘proq ma’lumot olishning o‘ziga xos usuli! 2️⃣ Shaxsiy psixologik tahlil 🧠 So‘rov (prompt): «Sen – shaxsiy rivojlanish bo‘yicha mutaxassis :: Barcha suhbatlarimni tahlil qilib, mening psixologik portretimni yarat :: Halol, aniq va tanqidiy bo‘l :: Har bir xulosani misollar bilan asosla» Natija: Sizning ichki olamingizni aks ettiruvchi chuqur tahlil. Ushbu xulosa yangi imkoniyatlarni ochib berishi va o‘zingizga tashqaridan qarashga yordam berishi mumkin. 3️⃣ Chin do‘stona maslahatlar 🤝 So‘rov (prompt): «Sen – mening eng yaqin do‘stim :: Mening barcha suhbatlarimni tahlil qilib, menga uchta halol va shaxsiy maslahat ber :: Har birining ahamiyatini tushuntir» Natija: ✅Energiyangni asosiy loyihalarga qarat. Sen juda ko‘p yo‘nalishlarga bo‘linib ketayotganing sababli, asosiy maqsadlaringga erishish sekinlashmoqda. Muhim narsalarga ko‘proq e’tibor qarat. ✅O‘zingga nisbatan yumshoqroq bo‘l. Sen o‘zingdan juda ko‘p narsa talab qilasan va ba’zan ortiqcha bosim o‘tkazasan. O‘zingga xatolar va tabiiy xatti-harakatlar uchun ruxsat ber – hayoting ancha yengil va yoqimli bo‘ladi. ✅Ichki sezgingga ishoning. Ko‘pincha mantiq va tahlilga tayangan holda qaror qabul qilasan. Lekin ichki sezgi ham katta kuchga ega. Ba’zan raqamlar tushunarsiz bo‘lsa ham, yuraging aytgan narsani eshit. 💭Xuddi yuragingga qaragan kabi! Bu promptlar sizga o‘zingiz haqingizda ko‘proq bilib olish va yangi fikrlarni kashf etishda yordam beradi. Saqlab qo‘ying va sinab ko‘ring!🚀 💎@kunuzai #AI#SuniyIntellekt#ChatGPT#O3mini
@kunuzai · Post #38 · 02.02.2025 г., 10:35
🌟O3-mini bilan ishlash bo‘yicha 4 ta maslahat OpenAI yangi O3-mini modelini taqdim etdi. Bu model oddiy til modellaridan farqli o‘laroq, mantiqiy fikrlash jarayonlarini o‘z ichida avtomatik ravishda amalga oshiradi. Ya’ni, sizdan qo‘shimcha harakat talab etilmaydi. Maksimal natijaga erishish uchun quyidagi maslahatlarga amal qiling: 1️⃣So‘rovlaringizni aniq va oddiy qiling O3-mini ichki mantiqiy tahlil qobiliyatiga ega. Shuning uchun ortiqcha yo‘riqnomalar kiritmang. ✅«Ushbu Python funksiyasidagi xatoni toping va uni tuzating.» ❌«Asta-sekin o‘ylang va funksiyani batafsil tahlil qilib chiqqach, xatolarni aniqlang va tuzating.» 2️⃣Mantiqiy tahlil zanjirlarini ishlatmang Model allaqachon o‘z ichida mantiqiy fikrlash ketma-ketligini yaratadi. «Bosqichma-bosqich fikrlash» yoki «o‘z mulohazalaringizni tushuntirish» kabi so‘rovlar samaradorlikni pasaytirishi mumkin. ✅ «Ushbu fizika masalasini yeching va yakuniy javobni bering.» ❌ «Bosqichma-bosqich o‘ylab, barcha hisob-kitoblaringizni yozing va har bir taxminni tushuntiring.» 3️⃣Aniq yo‘riqlar bering, ochiq so‘rovlarni emas Kerakli natijani olish uchun cheklovlar yoki talablarni aniq belgilang. ✅ «Quicksort algoritmi yordamida massivni saralash uchun 50 qatorli kod yozing.» ❌ «Saralash algoritmi yozing.» 4️⃣Ortiqcha kontekstni cheklang Tashqi manbalardan olingan ma’lumotlarni faqat eng muhim qismlari bilan cheklang. ✅ «Ushbu ilmiy maqolaning asosiy xulosalarini qisqacha yozing: …» ❌ «Mana 20 sahifalik ilmiy maqola. Asosiy xulosalarni umumlashtirib bering.» 🔖Saqlab qo‘ying va O3-mini bilan samarali ishlang!❤️@kunuzai #AI#O3mini#SuniyIntellekt#OpenAI
Hashtags
@venturevillagewall · Post #3606 · 20.12.2024 г., 18:41
O3 and O3-Mini Benchmark Breakthroughs The O3 and O3-Mini models showcase state-of-the-art (SOTA) performance with significant leaps in various benchmarks. Results on Frontier Math have jumped from 2% to 25%. The SWE-Bench model achieved a score of 71.7%, while a startup has raised $200 million following results of 13.86%. ELO on Codeforces reached 2727, surpassing most peers globally. Notably, the ARC-AGI model scored 87.5%, breaking a five-year benchmark. Access for security researchers to O3-Mini starts today, with general access available in late January. #O3#O3Mini#SOTA#Benchmarks#AI#ML#Funding#Codeforces#ARC-AGI #FrontierMath#SWE-Bench #ELO#GPQA#AIME#SecurityResearch#TechUpdates#Innovations#Startups#Performance#AIModels