TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #1084 · 9.04

В общем, была задача на оптимизацию плана работ: есть набор заказов, и в каждом N тасков. Таски могут зависеть друг от друга или нет, имеют длительность и тип. Ещё есть M работников, каждый из которых может выполнять таски только определённых типов, причём, у каждого своя скорость. Если все таски в заказе выполнены, фирма получает сколько-то денег. У заказа есть дедлайн, за просрочку штраф (за каждый день просрочки), который вычитается из цены заказа. И ещё фирма тратит деньги за каждый день своей работы независимо от того, как загружены её сотрудники (то есть просто платит зарплаты по сути). Ещё важен учёт праздников и выходных. Нужно заработать на определённом наборе заказов и работников как можно больше денег. Полный текст задачи и код программы проверки есть в репозитории. Эта задача является изменённым заказом, который мы с напарником решали в реальной жизни: оптимизация работы печатных станков для типографии. Правда, тогда и мы справились так себе, и заказчик в итоге сначала захотел всё вручную сам делать, а потом и вовсе похоронил проект при смене директора. !!! Не читайте дальше, если хотите сначала попробовать решить самостоятельно, потому что я сейчас опишу эффективные подходы и результаты. ________________________________________ Так вот. Мы с другим экспертом Андреем сразу сели и написали разные варианты, чтобы задать шкалу, по которой будем оценивать решения команд. За пару часов я собрал примитивный жадный алгоритм, который сортировал заказы по прибыльности и укладывал в сетку кое-как, это дало нам нижнюю оценку. Мой алгоритм заработал ~75 млн виртуальных рублей, мы решили для оценки поставить нижней границей 40 млн. То есть всё, что ещё ниже, оценивалось в ноль баллов за качество оптимизации. Затем Андрей закрылся дома на три дня и вышел на свет со сложным жадным алгоритмом, который очень хитро сортировал заказы и очень хитро укладывал их в сетку, попутно выбирая разные способы этой укладки в зависимости от конкретного заказа. Это позволило заработать ~275 млн рублей. Мы сделали верхней границей для оценки 280 млн. К сожалению, в итоге только две команды из десяти прошли нижнюю границу, заработав, соответственно, ~91 и ~105 млн. К верхней границе не приблизился никто. И у четырёх команд алгоритм вообще не смог уложить без нарушений задачи в сетку (то есть, например, произвольно менял длительности, накладывал задачи друг на друга, давал одному работнику две задачи в один момент и так далее). Важной ошибкой команд, на мой взгляд, являлся тот факт, что никто не воспользовался возможностью запустить алгоритм на несколько минут и дать ему поработать. По условиям задания, можно было тянуть до 5 минут на одну оптимизацию, но по факту решения команд отрабатывали за единицы и десятки секунд. На самом конкурсе, пока команды работали, я решил попробовать сделать быстрое (по времени написания) но эффективное решение. Сначала попробовал жадную сортировку + доведение до лучшего варианта методом имитации отжига. В качестве нового состояния я просто менял местами заказы целиком. Этот вариант работал пару минут и дал мне около ~200 млн дохода. К слову, команда-лидер использовала такой же подход, просто не докрутила число итераций и температуру. Ну и потом я взял готовую либу по реализации классической генетики с особями и скрещиванием. Особью был массив с приоритетами заказов (которые конечно же нужно было аккуратно уложить чистым алгоритмом). Тип скрещивания: scattered. Всего 15 поколений по 20 особей, и это за минуту-полторы давало ~230-240 млн. Считаю, что для конкурса это самый лучший выбор: пишется одним человеком за день и даёт почти максимум, при этом легко настраивается на нужную длительность работы, легко параллелится. Ну а потом уже дома я посидел и накодил свой вариант сложного жадного с плавающим окном перебора отсортированных заказов и плавающей же укладкой по работникам. Такая штука за две минуты зарабатывает ~281 млн. Но за три дня в условиях стресса я бы такое не сделал, скорее всего. #dev

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #computeruse

当前筛选 #computeruse清除筛选
AI一线|ShareCentre

@ShareCentre · Post #7204 · 17.04.2026 г., 02:35

OpenAI 升级 Codex:操控电脑、记忆偏好、90+ 新插件,全面迈向「超级开发 Agent」 OpenAI 于 4 月 16 日发布 Codex 年度最大规模更新。Codex 现已能在用户电脑上并行操作应用、生成图像、记住用户偏好、跨天/跨周自主推进长期任务,并通过 90 多个新插件接入 JIRA、GitLab、Microsoft Suite 等主流工具。每周活跃开发者已突破 300 万。 📌 核心信息 - 后台电脑操作(Computer Use):Codex 用自己的鼠标光标「看、点、输」,多个 Agent 可在 Mac 上并行工作,不干扰用户在其他 App 的操作;适合前端迭代、App 测试、无 API 工具的自动化 - 原生网页能力:App 内置浏览器,用户可直接在网页上评论以向 Agent 下达精确指令;初期聚焦前端和游戏开发,后续扩展到完整浏览器操控 - 图像生成:Codex 接入 gpt-image-1.5,可生成并迭代产品概念图、前端设计稿、Mockup 和游戏素材,与截图、代码在同一工作流内流转 - 90+ 新插件:整合 Skills + App 集成 + MCP Server,新增 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks、Remotion、Render、Superpowers 等 - 开发生命周期支持:处理 GitHub PR 评论、多终端标签页、SSH 连接远程 devbox(Alpha)、侧边栏富预览(PDF/表格/幻灯片/文档)、新 Summary 面板追踪 Agent 计划与产物 - 可复用自动化:重用历史对话线程保留上下文,Codex 可自主排期、跨天/跨周自动唤醒推进长任务,典型场景包括 PR 合并、Slack/Gmail/Notion 跟进 - 记忆预览版:记住用户偏好、以往修正和费时收集的上下文,无需反复写自定义指令 - 主动提议:结合项目、插件与记忆,Codex 会主动建议如何开启今日工作或接续前项目(如汇总 Google Docs 评论、拉取 Slack/Notion/代码库上下文形成优先级行动清单) ⚙️ 可用性 - 即日起向已登录 ChatGPT 的 Codex 桌面应用用户开放 - 记忆与上下文感知建议稍后向 Enterprise、Edu、欧盟、英国用户推送 - Computer Use 先上 macOS,欧盟、英国稍后跟进 🔙 Codex 近期动态 - 2026/03/17:GPT-5.4 mini/nano 发布并深度整合进 Codex 子代理架构 - 2026/03/19:收购 Python 工具商 Astral(uv/Ruff/ty),团队并入 Codex - 2026/03/20:Codex for Students,向美加大学生赠送 100 美元积分 - 2026/03/26:Plugins 系统上线,Skills + Apps + MCP 一键打包 - 2026/04/02:Codex 推出团队按量付费 - 周活跃开发者从年初 200 万增长到现在 300 万+ ⚔️ 竞品格局 - Anthropic Claude Code:年化收入 25 亿美元,近期发布 Routines(事件驱动自动化)、Ultraplan(云端规划)、Cowork Computer Use、Managed Agents - Cursor 3(Glass):围绕 Agent 从零重构 IDE,本地↔云端无缝交接、多仓库并行 - GitHub Copilot:依托 GitHub 生态深度集成 - Gemini CLI:开源 + 每日 1000 次免费额度 + Subagents - 国产阵营:千问 Qwen3.6-Plus、智谱 GLM-5.1、MiniMax M2.7 在 SWE-bench Pro / Terminal-Bench 上全面逼近或超越 Opus 4.6 🏢 战略解读 - Codex 从「终端里写代码」演进为跨编辑器、终端、浏览器、桌面 App 的统一 Agent 工作区,与 Cursor 3「以智能体为中心的统一工作区」思路殊途同归 - Computer Use + 90+ 插件 + 记忆三件套,是 OpenAI 对标 Claude Cowork Computer Use + Managed Agents 的正面回应 - 跨天跨周自动推进长任务 + 主动提议工作,标志 Codex 正从「被动助手」向「主动队友」转变,与 Claude Code Routines(4/14)同属同一产品范式 - OpenAI 在本次更新中罕见地提到「连接 Slack、Gmail、Notion」作为自动化典型场景,AI 编程工具的边界正加速外溢到企业协作平面 🔗 来源: openai.com/index/codex-for-almost-everything/ #AI#OpenAI#Codex#AIAgent#ComputerUse#Plugins