🔥Как работает нейросеть? — [9:59]
Нейросети уже заполонили мир, особенно ChatGPT и Midjourney, поэтому важно приблизительно понимать как они работают. В этом ролике речь пойдёт об общем строении ИИ, что такое нейрон, вес и как подбирается результат.
Перейти к просмотру
#видео#ai
Google AI 订阅者解锁 AI Studio 高级权益:Pro/Ultra 直通 Nano Banana Pro 与 Gemini Pro
Google 于 4 月 20 日宣布,Google AI Pro 与 Google AI Ultra 订阅用户即日起可在 Google AI Studio 中获得更高的使用额度,并直接访问 Nano Banana Pro(基于 Gemini 3 Pro 的图像生成模型)与 Gemini Pro 系列模型。对于已用完免费额度的开发者,Google AI 订阅计划现在成为一条低门槛的「计费通道」,让原型与实验阶段的开发者无需单独配置 API 密钥即可在 AI Studio 中继续构建。当应用准备上线时,可在 AI Studio 内一键切换到按量付费的 API 密钥设置。
⚙️ 关键变化
- Google AI Pro/Ultra 订阅覆盖 AI Studio 使用额度,不再挤占 Gemini App 的配额
- 订阅直通 Nano Banana Pro 和 Gemini Pro 模型,开发者开箱即用
- 官方明确两条路径:订阅做原型与深度实验,API 做生产级部署
- 从订阅切换到 API 可在 AI Studio 内顺畅完成
- 即日起面向所有 AI Pro 和 Ultra 订阅者滚动发布,需用已关联账户登录
💰 订阅档位速览
- Google AI Pro:约 $20/月,含 Gemini 3.1 Pro、5TB 存储、Veo 3.1 Lite 有限体验、Gemini in Gmail/Docs 等
- Google AI Ultra:$249.99/月(前三个月促销价 $124.99),含 3.1 Pro 最高额度、Veo 3.1 最高额度、Deep Think、Gemini Agent(仅美区)、Antigravity 最高速率、30TB 存储、YouTube Premium
🔙 背景
- AI Studio 从 Gemini API 调试工具演进为全栈开发平台的转型进入第二阶段
- 3 月 19-20 日 Google AI Studio 整合 Firebase 后端能力,并接入 Antigravity 编程代理,从 prompt 到全栈应用一键成型;Firebase Studio 同步宣布 2027 年 3 月 22 日日落
- Nano Banana Pro 基于 Gemini 3 Pro,2025 年 11 月发布,主打高保真图像、精准文字渲染与世界知识,此前仅在 Ultra 等高端入口全额开放
- Google AI Pro/Ultra 是 2025 年 5 月将原 Google One AI Premium 重塑后的新订阅体系,Ultra 定位对标 ChatGPT Pro 与 Claude Max
⚔️ 竞品动态
- Anthropic:Claude Code 订阅用户可在 Max 套餐内获得高额 token(Max 20x $200/月),但 4 月 4 日起切断第三方工具订阅通道,强制进入 Usage Bundles 或 API 按量付费
- OpenAI:4 月 9 日新增 $100/月 ChatGPT Pro 档位,Codex 用量最高提升 10 倍;3 月 20 日向美加大学生赠送 $100 Codex 积分
- Cursor:3 月 Composer 2 自研模型发布,$2.50/M 输入 token 激进定价;4 月 2 日 Cursor 3(Glass)围绕智能体重构 IDE
- Vercel v0、Bolt.new、Lovable、Replit 等 Vibe Coding 工具普遍采用订阅 + API 混合商业模式
📎 行业观察
订阅 + AI Studio 的组合让 Google 在 AI 开发者入口上形成完整闭环:Gemini 订阅覆盖日常模型访问,AI Studio 覆盖原型与全栈构建,Antigravity 覆盖本地 Agent IDE,API 覆盖生产部署。与 Anthropic 通过订阅打包 Claude Code 的思路同源,但 Google 把路径梳理得更清晰——免费体验、订阅原型、API 生产三段式分明。订阅作为「低门槛计费通道」的定位,本质上是把 AI Studio 从纯开发者工具升级为付费用户留存工具;叠加 3 月的 Firebase + Antigravity 整合,Google AI 开发者漏斗的每一层都被订阅体系串了起来。
📌 来源
- 官方博客:https://blog.google/innovation-and-ai/technology/developers-tools/google-one-ai-studio/
- Google AI 订阅说明:https://one.google.com/about/google-ai-plans/
- 相关背景:AI Studio 整合 Firebase https://firebase.blog/posts/2026/03/announcing-ai-studio-integration
#Google#AIStudio#Gemini#NanoBananaPro#VibeCoding#AI
🌟BitDance: авторегрессионная генерация изображений с бинарными токенами.
Генеративные модели делятся на 2 лагеря: диффузионные и авторегрессионные. Вторые концептуально ближе к LLM - генерируют изображение токен за токеном, как текст. Проблема в том, что это очень медленно, а качество проигрывает диффузии.
BitDance - экспериментальная 14B AR-модель, которая пытается решить оба этих вопроса разом.
Этим проектом группа китайских рисёчеров показала, что правильный бинарный токенизатор + diffusion head + параллельный патчинг закрывает большинство претензий.
Они локализовали 3 проблемы дискретных AR-моделей и закрыли каждую отдельным решением.
🟡Плохая реконструкция токенизатора
Вместо VQ-кодбука тут используется бинарный токенизатор на основе квантования с групповым разбиением каналов. Словарь вырастает до 2²⁵⁶ (для сравнения: у Cosmos - 65536), при этом модель держит PSNR 25.29 против 24.81 у непрерывного DC-AE, то есть бинарные токены реконструируют изображение лучше, чем VAE у SANA.
🟡Нестабильный сэмплинг
А как вообще выбирать из словаря в 2²⁵⁶ вариантов? Обучить классификатор на все возможные токены тут не вариант: такой слой не поместится ни в какую память. В качестве решения - прикрутили diffusion head, которая моделирует биты на непрерывном гиперкубе. То есть, модель предсказывает структуру битов через velocity-matching, что и позволяет сэмплить из гигантского пространства состояний.
🟡Скорость
AR генерирует по одному токену за шаг. BitDance за один шаг выдает сразу 64 токена (или 16), при этом модель понимает, как они связаны между собой внутри этого блока. Громко заявленный результат: 30x ускорение относительно next-token AR при сопоставимом качестве. об этом в конце
🟡Тесты
На мелкой версии ImageNet BitDance-H достигает FID 1.24 (лучший результат среди AR-моделей, наравне с xAR-H).
На DPG-Bench (text-to-image) полноценная BitDance набирает 88.28 - это выше FLUX.1-Dev, SD3, Janus-Pro, но уступает Seedream 3.0 и Qwen-Image.
В релизе 2 версии 14B модели, с предикшеном на 16 и 64 токена и макс. разрешением 1Мpx.
Остается вопрос: насколько бинарный токенизатор + diffusion head добавляет латентности на каждом шаге, даже если самих шагов стало меньше из-за патчинга.
30x по скорости - это сравнение не с диффузионными моделями, которые уже умеют генерировать за 4–8 шагов.
14B - это не про "взял и запустил". Есть конечно версии на ImageNet с разрешением 256х256 для воспроизведения эксперимента, но не за этим мы сюда пришли.
📌Лицензирование: Apache 2.0 License.
🟡Страница проекта
🟡Arxiv
🟡Модель
🟡Demo
🖥GitHub
@ai_machinelearning_big_data
#AI#ML#AR#T2I#BitDance
听 Acquired 讲 Google AI 史这期听到一个 fun fact: Google 进军自动驾驶早期(2013)曾经考虑过要不要收购 Tesla,当年谈的价格是 30 亿美金(Tesla 现在市值是 1380 亿)。如果当年这个收购完成,也不会有现在的 Tesla 和 openAI (Elon Musk 当年投资 openAI 一部分原因是想让他们来研究自动驾驶,后来也因此谈崩)。好有意思的 what if 平行宇宙可能性。
#podcast#AI#tech#Google#Tesla#funfact
🌟Lyra 2.0: фреймворк для генерации исследуемых 3D-миров по одной фотографии.
NVIDIA опубликовала веса модели и код Lyra 2.0 - системы, которая принимает на вход изображение, генерирует видео с управляемой траекторией камеры, а затем реконструирует его в 3D-гауссианы и полигональные меши.
Готовые ассеты можно напрямую импортировать в игровые движки и робототехнические симуляторы.
Система будет полезна для массовой генерации тренировочных 3D-сред для воплощенного ИИ.
Главная задача, которую решает фреймворк - сохранение согласованности сцены при длительном пролете камеры.
Lyra 2.0 хранит 3D-геометрию каждого кадра в отдельном кэше, при возврате извлекает релевантные исторические кадры по степени перекрытия видимости и устанавливает плотные геометрические соответствия через варпинг канонических координат.
Геометрия используется только для маршрутизации информации - какие кадры извлечь и как их сопоставить с текущим ракурсом. За синтез внешнего вида отвечает диффузионная модель.
Базовая модель построена на архитектуре Wan 2.1-14B с выходным разрешением 832×480.
Для 3D-реконструкции применяется дообученная версия Depth Anything v3 в feed-forward режиме, а поверхностные меши извлекаются через иерархический подход на основе OpenVDB.
На бенчмарках DL3DV и Tanks and Temples Lyra 2.0 превзошла все аналоги (GEN3C, CaM, SPMem, VMem, Yume-1.5 и HY-WorldPlay) практически по всем метрикам: FID, SSIM, LPIPS, субъективное качество и стилистическая согласованность.
Первая версия фреймворка, вышедшая в сентябре, поддерживала лишь генерацию на коротких дистанциях. Ближайший конкурент второй версии, Genie 3 от Google, обладает схожими возможностями, но остаётся закрытым.
🟡Страница проекта
🟡Arxiv
🟡Модель
🖥GitHub
@ai_machinelearning_big_data
#AI#ML#3DWorlds#Lyra2#NVIDIA
🚀 Go! Nation, Interested in tokenized futures?
We’re talking about a massive unlock: equities are ~$128T globally, and the broader futures/derivatives layer is $1 quadrillion+ in notional scale. That’s the playing field.
Futures are like making a deal today on what something will cost later (like locking in the price of apples next week).
Equities are just tiny pieces of companies.
FuturesFi is Go!’s next step: putting U.S. index futures strategies on-chain so people can access them in smaller, modular, transparent, fully trackable digital contracts. Think: clearer exposure, better rails, and a path to modern financial infrastructure, without the old gatekeeping.
FuturesFi is being designed to target low-single-digit monthly performance in modeled scenarios via U.S. index futures strategies. No guarantees, not live performance, and not an offer to sell securities, just early interest for product updates.
Important compliance note: Go!/FuturesFi is not a broker-dealer. This is not an offer to sell securities and nothing here is investment advice, we’re simply collecting interest for early access + product updates.
👉 Join the interest list here:
https://forms.gle/wFY1534X8xqSUUtf7
#FuturesFi#Agentic#AI#Tokenization#OnChainFinance#DigitalAssets#Assets#LetsGo
🚀 Google похоронил всех ИИ-помощников. Знакомьтесь: Antigravity
Вчера, вместе с Gemini 3, Google выкатили Antigravity. И это уже не «ассистент» — это полноценная DEV-команда у вас в компьютере.
⚙️ Что это меняет:
⏺️Полный цикл: От идеи до работающего продукта. ИИ сам создаёт структуру, деплоит и поддерживает проект.
⏺️Не просто пишет код: Агенты работают с кодом, терминалом и браузером как живые разработчики.
⏺️Качество: Код доводится до состояния «продакшн-реди».
⏺️Масштаб: Создаёт игры, сайты, приложения. Можно запускать до 10 задач параллельно.
⏺️Всё включено: Автоапдейты, тесты, багфиксы, отчёты.
💎 Техническая основа:
Работает на связке топ-моделей — Gemini 3 Pro, Claude Sonnet 4.5, GPT-OSS.
✅ И главное: Даже на бесплатном тарифе лимиты более чем щедрые.
Antigravity уже доступен на MacOS, Windows и Linux.
#Google#Antigravity#AI#Разработка#Gemini#DevOps
Нейроофис💀
🚀 Вышел QwenLong-L1.5 - модель для long-context reasoning, которая на длинных контекстах конкурирует с GPT-5 и Gemini-2.5-Pro.
Коротко о модели
- 30B параметров, из них 3B активных
- Заточена под рассуждение на очень длинных контекстах
- Полностью открыты веса, код обучения и рецепты данных
Ключевые показатели:
- +31.7 балла на OpenAI MRCR при контексте 128K - SOTA среди всех моделей
- На уровне Gemini-2.5-Pro на 6 крупных long-QA бенчмарках
- +9.69 на CorpusQA
- +6.16 на LongBench-V2
Что интересного.
1. Синтетические данные в масштабе
14.1K длинных reasoning-сэмплов из 9.2B токенов без ручной разметки.
Средняя длина - 34K токенов, максимум - 119K.
2. Стабильное RL-обучение
Используется балансировка задач и Adaptive Entropy-Controlled Policy Optimization (AEPO), что позволяет стабильно обучать модели на длинных последовательностях.
3. Архитектура с памятью
Итеративные обновления памяти за пределами окна 256K токенов.
Результат - +9.48 балла на задачах с контекстом от 1M до 4M токенов.
QwenLong-L1.5 - это один из самых сильных open-source шагов в сторону реально масштабируемого ризонинга с длинным контекстом
Модель интересна не только результатами, но и тем, что весь стек обучения открыт.
GitHub: https://github.com/Tongyi-Zhiwen/Qwen-Doc
Paper: https://modelscope.cn/papers/2512.12967
Model: https://modelscope.cn/models/iic/QwenLong-L1.5-30B-A3B
HF: https://huggingface.co/Tongyi-Zhiwen/QwenLong-L1.5-30B-A3B
@ai_machinelearning_big_data
#AI, #LLM, #opensource, #long#Owen