TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #367 · 30.05

Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #computeruse

当前筛选 #computeruse清除筛选
AI一线|ShareCentre

@ShareCentre · Post #7204 · 17.04.2026 г., 02:35

OpenAI 升级 Codex:操控电脑、记忆偏好、90+ 新插件,全面迈向「超级开发 Agent」 OpenAI 于 4 月 16 日发布 Codex 年度最大规模更新。Codex 现已能在用户电脑上并行操作应用、生成图像、记住用户偏好、跨天/跨周自主推进长期任务,并通过 90 多个新插件接入 JIRA、GitLab、Microsoft Suite 等主流工具。每周活跃开发者已突破 300 万。 📌 核心信息 - 后台电脑操作(Computer Use):Codex 用自己的鼠标光标「看、点、输」,多个 Agent 可在 Mac 上并行工作,不干扰用户在其他 App 的操作;适合前端迭代、App 测试、无 API 工具的自动化 - 原生网页能力:App 内置浏览器,用户可直接在网页上评论以向 Agent 下达精确指令;初期聚焦前端和游戏开发,后续扩展到完整浏览器操控 - 图像生成:Codex 接入 gpt-image-1.5,可生成并迭代产品概念图、前端设计稿、Mockup 和游戏素材,与截图、代码在同一工作流内流转 - 90+ 新插件:整合 Skills + App 集成 + MCP Server,新增 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks、Remotion、Render、Superpowers 等 - 开发生命周期支持:处理 GitHub PR 评论、多终端标签页、SSH 连接远程 devbox(Alpha)、侧边栏富预览(PDF/表格/幻灯片/文档)、新 Summary 面板追踪 Agent 计划与产物 - 可复用自动化:重用历史对话线程保留上下文,Codex 可自主排期、跨天/跨周自动唤醒推进长任务,典型场景包括 PR 合并、Slack/Gmail/Notion 跟进 - 记忆预览版:记住用户偏好、以往修正和费时收集的上下文,无需反复写自定义指令 - 主动提议:结合项目、插件与记忆,Codex 会主动建议如何开启今日工作或接续前项目(如汇总 Google Docs 评论、拉取 Slack/Notion/代码库上下文形成优先级行动清单) ⚙️ 可用性 - 即日起向已登录 ChatGPT 的 Codex 桌面应用用户开放 - 记忆与上下文感知建议稍后向 Enterprise、Edu、欧盟、英国用户推送 - Computer Use 先上 macOS,欧盟、英国稍后跟进 🔙 Codex 近期动态 - 2026/03/17:GPT-5.4 mini/nano 发布并深度整合进 Codex 子代理架构 - 2026/03/19:收购 Python 工具商 Astral(uv/Ruff/ty),团队并入 Codex - 2026/03/20:Codex for Students,向美加大学生赠送 100 美元积分 - 2026/03/26:Plugins 系统上线,Skills + Apps + MCP 一键打包 - 2026/04/02:Codex 推出团队按量付费 - 周活跃开发者从年初 200 万增长到现在 300 万+ ⚔️ 竞品格局 - Anthropic Claude Code:年化收入 25 亿美元,近期发布 Routines(事件驱动自动化)、Ultraplan(云端规划)、Cowork Computer Use、Managed Agents - Cursor 3(Glass):围绕 Agent 从零重构 IDE,本地↔云端无缝交接、多仓库并行 - GitHub Copilot:依托 GitHub 生态深度集成 - Gemini CLI:开源 + 每日 1000 次免费额度 + Subagents - 国产阵营:千问 Qwen3.6-Plus、智谱 GLM-5.1、MiniMax M2.7 在 SWE-bench Pro / Terminal-Bench 上全面逼近或超越 Opus 4.6 🏢 战略解读 - Codex 从「终端里写代码」演进为跨编辑器、终端、浏览器、桌面 App 的统一 Agent 工作区,与 Cursor 3「以智能体为中心的统一工作区」思路殊途同归 - Computer Use + 90+ 插件 + 记忆三件套,是 OpenAI 对标 Claude Cowork Computer Use + Managed Agents 的正面回应 - 跨天跨周自动推进长任务 + 主动提议工作,标志 Codex 正从「被动助手」向「主动队友」转变,与 Claude Code Routines(4/14)同属同一产品范式 - OpenAI 在本次更新中罕见地提到「连接 Slack、Gmail、Notion」作为自动化典型场景,AI 编程工具的边界正加速外溢到企业协作平面 🔗 来源: openai.com/index/codex-for-almost-everything/ #AI#OpenAI#Codex#AIAgent#ComputerUse#Plugins