TGTGInsighttelegram intelligenceLIVE / telegram public index
← Midjourney/Nano Banana Prompts NeuroSpark

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @Shutter · Post #4607 · 22 mai

Harbor, cargo port, ships #AI#artificial_Intelligence

Résultats

10,064 posts similaires trouvés

Recherche globale générale

AI一线|ShareCentre

@ShareCentre · Post #7234 · 24/04/2026 02:06

OpenAI 发布 GPT-5.5:最强智能跃迁,同延迟下全面超越自身与竞品 OpenAI 于美国时间 4 月 23 日正式发布 GPT-5.5,定位为「迄今最聪明、最直观」的旗舰模型,同步推出推理增强版 GPT-5.5 Pro。新模型在编码、计算机操作、知识工作和早期科学研究场景全面跃迁,Terminal-Bench 2.0 刷出 82.7% 的 SOTA,并在保持 GPT-5.4 同级每 token 延迟的前提下实现,被 OpenAI 称为「一种全新的工作方式」。 📌 核心要点 - 发布时间:2026-04-23(北京时间 4/23 夜–4/24 凌晨) - 产品矩阵:GPT-5.5(主力)+ GPT-5.5 Pro(推理增强)两档同步上线 - 开放范围:即日起向 ChatGPT 和 Codex 的 Plus / Pro / Business / Enterprise 推送;GPT-5.5 Pro 限 Pro / Business / Enterprise - API:部署「很快」跟进,正与合作伙伴对齐大规模部署所需安全与合规要求 - 安全:200 名可信早期合作伙伴内部红队 + 外部红队 + 网络安全/生物学定向测试,OpenAI 称迄今最严苛的一次发布 📊 关键基准(GPT-5.5 / GPT-5.4 / GPT-5.5 Pro / Claude Opus 4.7 / Gemini 3.1 Pro) - Terminal-Bench 2.0:82.7 / 75.1 / — / 69.4 / 68.5 - Expert-SWE(内部):73.1 / 68.5 / — / — / — - GDPval(胜或平):84.9 / 83.0 / 82.3 / 80.3 / 67.3 - OSWorld-Verified:78.7 / 75.0 / — / 78.0 / — - Toolathlon:55.6 / 54.6 / — / — / 48.8 - BrowseComp:84.4 / 82.7 / 90.1 / 79.3 / 85.9 - FrontierMath 1–3:51.7 / 47.6 / 52.4 / 43.8 / 36.9 - FrontierMath 4:35.4 / 27.1 / 39.6 / 22.9 / 16.7 - CyberGym:81.8 / 79.0 / — / 73.1 / — 其他亮点:SWE-Bench Pro 58.6%、Tau2-bench Telecom 98.0%(零 prompt 调优)、OfficeQA Pro 54.1%、FinanceAgent 60.0%、内部投行建模 88.5%。Artificial Analysis Coding Index 显示 GPT-5.5 以竞品约一半的成本达到 SOTA 智能。 ⚙️ 能力跃迁三大方向 1. 智能体编码(Agentic Coding) - Terminal-Bench 2.0 82.7% 登顶,长任务规划/迭代/工具协调全面强化 - Every CEO Dan Shipper:「第一个具备严肃概念清晰度的编码模型」——GPT-5.4 做不到的重构,GPT-5.5 一次还原资深工程师数天工作 - MagicPath CEO Pietro Schirano:约 20 分钟一次性合并数百个前端与重构改动 - NVIDIA 工程师:「失去 GPT-5.5 访问权限感觉像被截肢」 - Cursor CEO Michael Truell:「更聪明、更坚持、工具使用更可靠,长任务不轻易提前停止」 1. 计算机使用与知识工作 - OSWorld-Verified 78.7%,Codex 端可生成文档/表格/幻灯片并操作真实界面 - OpenAI 内部 85%+ 员工每周使用 Codex,覆盖工程、财务、传讯、市场、数据、产品 - 财务团队用 Codex 审阅 24,771 份 K-1 税表/71,637 页,比去年提速两周 - GTM 团队周报自动化,每周节省 5–10 小时 - ChatGPT 中 GPT-5.5 Thinking / GPT-5.5 Pro 在业务、法律、教育、数据科学显著提升 1. 科学研究 - GeneBench(多阶段基因组/定量生物数据分析)和 BixBench(真实生物信息学)上取得领先 - 内部定制 harness 的 GPT-5.5 协助发现了一个关于 Ramsey 数的新证明,已在 Lean 中验证 - Jackson 实验室免疫学教授 Derya Unutmaz:用 GPT-5.5 Pro 分析 62 样本 × 28000 基因的数据集,产出「团队数月才能完成」的研究报告 - 波兰数学家 Bartosz Naskręcki:11 分钟用 Codex 从一条 prompt 构建代数几何可视化 App - Axiom Bio CEO:「如果 OpenAI 保持这个节奏,药物发现的基础将在年底前改变」 🚀 推理效率的底层突破 - GPT-5.4 级别延迟 + GPT-5.5 级别智能:通过端到端系统级重设计打破「大模型更慢」的惯性 - 与 NVIDIA GB200 / GB300 NVL72 联合设计,从训练到服务全栈协同 - Codex 反哺基础设施:分析数周真实流量,自主编写负载均衡与分区启发式算法,token 生成速度提升超过 20%——模型在优化服务自己的基础设施 🛡 安全与网络安全 - 延续 2025 年 12 月 GPT-5.2 的网络安全专项安全措施,本次部署更严格的网络风险分类器,OpenAI 承认「部分用户初期可能觉得烦人」,将持续调优 - 针对高风险活动、敏感网络请求和重复滥用增加定向保护 - 发布前与外部专家合作数月,用于身份验证访问、使用监控和滥用防范 🔙 OpenAI 近期动态串联 - 2026-03-17:GPT-5.4 mini/nano 发布,分层 Agent 架构成型 - 2026-03-19:收购 Astral(Python 工具链),并入 Codex - 2026-03-26:Codex 推出 Plugins 系统(Skills + Apps + MCP) - 2026-04-01:完成 1220 亿美元融资,估值 8520 亿美元 - 2026-04-14:TAC 扩展 + GPT-5.4-Cyber 网络安全专用模型发布 - 2026-04-16:Codex 年度最大更新——Computer Use + 90+ 插件 + 记忆 + 跨天长任务,周活跃开发者突破 300 万 - 2026-04-19:GPT Pro 被曝「暗中升级」,疑似 SPUD(即 GPT-5.5)提前登场 - 2026-04-22:ChatGPT Images 2.0 发布 - 2026-04-23:GPT-5.5 / GPT-5.5 Pro 正式发布 ⚔️ 竞品格局 - Anthropic Claude Opus 4.7(4/16):编码与视觉能力升级;本次在 Terminal-Bench 2.0、OSWorld、CyberGym 三项上被 GPT-5.5 明显拉开,但在 BrowseComp 单项仍低于 GPT-5.5 Pro(79.3 vs 90.1);Anthropic 同期以 Claude Design 和 Managed Agents 扩向应用层 - Google Gemini 3.1 Pro:GDPval 67.3% 与 FrontierMath 等基准上差距拉大,但在 Chrome / Workspace / 桌面原生 App 分发上保持生态优势 - 开源阵营:智谱 GLM-5.1(SWE-Pro 58.4 登顶开源)、千问 Qwen3.6-Plus(Terminal-Bench 超 Opus 4.5)、MiniMax M2.7、腾讯混元 Hy3、Kimi K2.6(SWE-Pro 58.6)——GPT-5.5 在编码核心基准上仍保持代差领先,但差距首次进入「一代」以内 - Cursor 3(Glass):以智能体为中心的 IDE 重构;Cursor CEO 明确背书 GPT-5.5 🏢 战略解读 - 「同延迟 + 大幅更强」是新的商业杠杆:token 更少 + 智能更高 + 延迟不变,对 Codex/Agent 场景意味着单位成本的阶跃式下降 - 模型与基础设施的飞轮闭环:GPT-5.5 自己优化自己服务的基础设施,与 MiniMax M2.7 的「模型自我进化」形成不同路径——OpenAI 走工程闭环,MiniMax 走训练闭环 - 安全收紧成为「可规模化部署」的前置条件:API 延后上线 + 网络安全分类器收紧,是 OpenAI 对 Anthropic Mythos「太危险不发布」路线的务实回应——发布,但先把安全护栏建足 - 研究用 AI 成为新竞争维度:Ramsey 数和 GeneBench 的真实贡献,标志前沿模型正从「写代码、做表格」走向「参与真实科研产出」 - ChatGPT vs Codex 双入口并行:GPT-5.5 Thinking 面向消费级 Pro 用户,Codex 面向开发者与企业工作流,OpenAI 首次明确「ChatGPT Pro = 研究伙伴」「Codex = 工程与业务执行」的产品分层 🔗 来源: http://openai.com/index/introducing-gpt-5-5/ #AI#OpenAI#GPT55#Codex#ChatGPT#AIAgent#TerminalBench

Machinelearning

@ai_machinelearning_big_data · Post #9167 · 03/12/2025 15:59

🌟Trinity Nano и Trinity Mini: ответ американских разработчиков на китайское доминирование. В последний год любой, кто следит за развитием моделей с открытыми весами знает - Китай недостижим. Qwen и DeepSeek фактически задали стандарт того, как должна выглядеть современная архитектура MoE. В США же большинство компаний занимались лишь доработкой чужих чекпоинтов. И вот, американская компания Arcee AI собралась Make America Great Againвернуть инициативу и создать семейство открытых моделей, обученных "от и до" в США, весами которых бизнес может владеть по-настоящему. Компания столкнулась с тем, что корпоративным клиентам нужна "юрисдикционная безопасность" . Специалистов по комплаенсу уже не устраивает ответ "мы дообучили модель неизвестного происхождения". Им нужен полный контроль над пайплайном данных. Семейство моделей Arcee AI получило имя Trinity. Пока в превью-релиз вошли 2 конфигурации: 🟢Trinity Mini — это обычная ризонинг-модель на 26 млрд. общих и 3 млрд активных параметров, обученная с нуля. 🟢Trinity Nano Preview — это модель чата. Она создана, чтобы быть харизматичной и интересной в общении несмотря на свои скромные 6 млрд. общих и 1 млрд. активных параметров. И пока мы тестируем Nano и Mini, Arcee AI тренирует флагмана Trinity Large. Его релиз запланирован на январь 2026 года. Это будет модель на 420 млрд. параметров, из которых 13 млрд. будут активны. Обе доступные модели, Trinity Nano и Trinity Mini выпущены под лицензией Apache 2.0. Они опубликованы на Hugging Face и поддерживаются llama.cpp, LM Studio и vLLM. Mini также доступна через OpenRouter по очень привлекательной цене - около 4,5 центов за 1 млн. токенов. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей 🟡Demo Trinity Mini @ai_machinelearning_big_data #AI#ML#MoE#Trinity#ArceeAi

科技&趣闻&杂记

@kejiqu · Post #3839 · 26/10/2025 09:52

AI聊天机器人使用与谷歌搜索不同的信息来源,并且经常引用鲜为人知的网站 鲁尔波鸿大学和马克斯·普朗克软件系统研究所的研究发现,人工智能聊天机器人与传统搜索引擎在选择信息来源和呈现信息的方式上有所不同。研究指出,人工智能聊天机器人倾向于使用与谷歌搜索不同的信息来源,并且经常引用知名度较低的网站。THE DECODER 🏷#AI#搜索引擎#来源#聊天机器人 📢频道👥群组📝投稿

Machinelearning

@ai_machinelearning_big_data · Post #9453 · 30/01/2026 10:05

🌟PaddleOCR-VL-1.5: компактная модель для сложного парсинга. PaddlePaddle обновили свою линейку PaddleOCR-VL, выпустив PaddleOCR-VL-1.5 - компактную VLM на 0.9 млрд. параметров на базе ERNIE-4.5-0.3B-Paddle. Несмотря на скромный размер, в задачах разбора документов она показывает SOTA-результаты. На тесте OmniDocBench v1.5 модель выбила 94.5% точности, обойдя не только прошлую версию, но и более тяжелых конкурентов. Фишка обновления - упор на полевые условия. Модель специально учили работать с плохими исходниками: кривыми сканами, бликами от мониторов и мятыми страницами. Попутно сделали бенчмарк Real5-OmniDocBench, который гоняет модели по 5 сценариям: сканирование, перекосы, деформация листа, фото с экрана и плохое освещение. 🟡В 1.5 добавили: 🟢Text spotting: находит и распознает текст одновременно (печатный русский - неплохо, рукописный - почти никак) 🟢Seal recognition: распознает печати (русские - не очень, китайские - на ура). 🟢Cross-page table merging: умеет склеивать таблицы, которые разорваны между страницами. 🟢Работа с заголовками: не теряет структуру параграфа при переходе на новый лист. 🟢Новые языки: добавили поддержку тибетского и бенгальского, подтянули распознавание редких символов и древних текстов. 🟡Деплой - на любой вкус Модель работает с transformers, дружит с Flash Attention 2 и, само собой, поддерживается PaddlePaddle 3.2.1. Если нужно быстро поднять сервис - есть готовый Docker-образ. 🟡Пара важных моментов по использованию Если нужен полноценный постраничный парсинг всего документа, лучше использовать официальный пакет PaddleOCR. Реализация через transformers пока ограничена только распознаванием отдельных элементов и споттингом. В пайплайн встроили логику препроцессинга. Если картинка меньше 1500 пикселей, она автоматом апскейлится фильтром Lanczos. При этом есть потолок в 1.6 млн. пикселей для споттинга, это чтобы не перегружать память GPU и сохранить читаемость мелкого шрифта. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🟡Demo 🟡DeepWiki 🖥Github @ai_machinelearning_big_data #AI#ML#VL#OCR#PaddleOCR

科技&趣闻&杂记

@kejiqu · Post #3765 · 16/09/2025 01:52

阿里 Qoder 正式开放订阅:Credits 耐用度提升 1/3,可一次检索 10 万个代码文件 阿里 Agentic 编程平台 Qoder 于 2025 年 8 月 21 日公测,现已面向全球用户推出付费订阅计划。Pro 版每月 20 美元,Pro + 版每月 60 美元。Qoder 集成全球顶尖编程模型,提供强大的上下文工程能力,可一次检索 10 万个代码文件,并通过 AI 自主研发提升软件开发效率。Pro 版权益包括无限代码补全、2,000 Credits、Quest Mode 和 Repo Wiki。Pro+ 版权益类似,但提供 6,000 Credits。新用户可享两周免费试用,包含 1,000 Credits。Repo Wiki 支持共享和自动检测代码变更。Qoder 团队通过技术升级,降低了单任务 token 消耗,提升 Credits 使用效率。IT之家 🏷#Qoder#AI#编程#Credits 📢频道👥群组📝投稿

科技&趣闻&杂记

@kejiqu · Post #3720 · 22/08/2025 02:18

阿里发布 AI 编程工具 Qoder:限时免费 阿里 Agentic 编程平台 Qoder 今日面向全球发布。该平台集成了全球顶尖的编程模型,具备强大的上下文工程能力,可一次检索 10 万个代码文件。Qoder 内置代码检索引擎,并率先支持 Repo Wiki。其集成长短期记忆系统,可基于会话历史总结项目经验。Qoder 新增 Quest Mode,实现 AI 自主研发,开发者可将任务委派给 Agent 执行,开发效率有望提升 10 倍以上。Qoder 支持 Windows 和 macOS 版本,目前可免费使用。IT之家 | Qoder 🏷#Qoder#AI#编程#效率 📢频道👥群组📝投稿

BesnowCloud貝雪雲-公告頻道

@besnow_cloud · Post #2991 · 24/04/2025 07:52

🔊【#深度解读】 【未来已来】你以为 AI 只会取代重复性工作?DeepMind 联合创始人、微软 AI 掌门人 Mustafa Suleyman 独家揭秘:从“幻觉”真相到 AGI 边界,从 Copilot 革命到工作新生态,6 大主题带你直击 AI 势不可挡的未来! 👇点击下方链接,直达深度访谈全文,让我们一起洞见下一个时代! #人工智能#AI#AGI#科技#未来#工作革命 👉阅读全文

12•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••550•••600•••650•••680681682683684•••700•••750•••800•••838839