🚀 Tencent Hunyuan только что выкатили AutoCodeBench — мощный open-source инструмент для проверки способностей ИИ в генерации кода.
Что внутри?
🔹AutoCodeGen — генерация многоязычных датасетов кода без ручной разметки
🔹AutoCodeBench — почти 4 000 сложных задач на 20 языках программирования (версии Full / Lite / Complete)
🔹MultiLanguageSandbox — песочница для работы с поддержкой 30+ языков
C AutoCodeBench можно быстро тестировать LLM в кодинге, сравнивать модели и даже создавать свои бенчмарки.
🟠Статья: arxiv.org/abs/2508.09101
🟠Код: github.com/Tencent-Hunyuan/AutoCodeBenchmark
🟠Датасет: huggingface.co/datasets/tencent/AutoCodeBenchmark
@ai_machinelearning_big_data
#AutoCodeBench#AI#coding
CodeCarbon - автоматический расчет выбросов СО2 при компьютерных вычислениях
CodeCarbon - библиотека в Питоне 🐍, которая может быть инетерсна стартаперам в climate-tech, или интересующимся темой устойчивого развития в технологических компаниях. CodeCarbon позволяет программистам или инженерам по машинному обучению отслеживать выбросы, измеряемые в килограммах эквивалента CO₂ (CO₂экв), чтобы оценить углеродный след обучения очередной супер-пупер ИИ модели.
CodeCarbon использует довлольно простую методологию рассчетов выбросов углекислого газа в зависимости от источника энергии снабжающего ваши (облачные) сервера и от того как вы обучаете свою ИИ модель, ну или делаете другого рода вычисления.
Все довольно просто, добавляете пару строк кода и вот вы уже осознанный эколог и можете репортить ваши метрики устойчивого развития или компенсировать выбросы СО2.
#climate#coding
🚀 Claude Opus 4.1: Ответ Anthropic перед GPT-5
Пока все ждут GPT-5 (ожидается в августе), Anthropic выпустил Claude Opus 4.1 — обновление флагмана с упором на кодирование, рассуждения и агентные задачи.
Главное:
▫️Прорыв в коде: Точность на SWE-bench Verified — 74.5% (+2% к Opus 4).
▫️Для разработчиков: Уже в GitHub Copilot (Pro+/Enterprise). GitHub хвалит улучшения в рефакторинге, Rakuten — хирургическую точность исправлений.
▫️Рыночные позиции: Доля Anthropic в корпоративном ИИ — 32% (OpenAI — 25%).
Тесты:
▫️Рост: GPQA Diamond (80.9%), AIME 2025 (78.0%).
▫️Спад: TAU-bench (авиакатегория).
Где: Claude (подписка), API, AWS Bedrock, Google Vertex AI, GitHub Copilot.
💬 Ваше мнение? Значимое обновление? Кто лидирует в гонке?
#Claude#Anthropic#Opus41#ИИ#AI#GPT5#Coding
Подробнее
https://t.me/semasci
#AI
Немного ИИ-теории
❗️В недавнем иске против компании OpenAI Илон Маск утверждал, что GPT-4 является ранним AGI, по сути равным человеческому интеллекту.
Что же такое AGI и когда он появится?
👤Сэм Альтман, CEO Open AI определяет AGI (artificial general intelligence) как интеллект, равный уровню обычного человека, который можно было бы принять в команду как сотрудника. Также популярно определение AGI как «системы, способной выполнить любую когнитивную задачу, доступную человеку».
📎Для справки: существует несколько видов (уровней развития) ИИ, а именно узкий ИИ (narrow, ANI), общий ИИ (genreal, AGI) и супер ИИ (super AI, ASI).
⏲Исследователи никак не могут прийти к консенсусу относительно даты появления AGI. По результатам Expert Survey on Progress in AI, существует 50% шанс того, что AGI появится до 2059 года. Тем не менее, поле ИИ изменяется постоянно и становится сложным оставаться в курсе событий.
⭐️Для этого мы нашли крупнейшее русскоязычное AGI-сообщество agirussia.org — у них есть канал и группа в Telegram.
🌐еще проходят еженедельные онлайн-семинары по тематике AGI на русском языке, записи семинаров за последние несколько лет доступны на YouTube и их сообществе в ВК.
Держим руку на пульсе ИИ⭐
⭐️Автор, Анна, @qcuqueen
❤️Интервью Павла Дурова на русском в 4k@durov
🎞 Ссылка на Youtube
Решил поиграться с нашим #AI и перевести видео с липсинком полностью через бот @plasma_gpt_ai_bot На русский в разы сложнее переводить, чем на английский.
Смотрите, что получилось)
👌 Новый #AI технологии на страже HR/HH. Если вы руководите компанией, то внедрение таких ботов в ваши бизнес процессы управления кадрами сильно сэкономит бюджет и повысит x10 качество кандидатов! Можно собрать сегодня даже no-code / no-budget решение самому!
Eсли вам все уже нужен быстрый и качественный подбор сложных IT кадров, или вы сами ищите работу, то рекомендую моего топового рекрутера @mikevolkov
Также я постоянно расширяю наш штат senior solidity / react / python разработчиков. Так что шлите мне @ilia_0x ваше резюме если готовы работать на интересных проектах в международных стартапах!)
#AI моделька, которая оживляет фотографии и эмитирует мимику лица и движение головы в зависимости от контекста речи. Выглядит достаточно правдоподобно.
🤩