Намери подобно съдържание

Изходен канал @clockstackwheels · Post #396 · 22.06

Попробовал Github Copilot. Это проект, в рамках которого Гитхаб обучил нейросеть на миллионах строк программного кода, загруженного людьми, и теперь она вроде как способна предлагать автоматическое дополнение к тому, что вы пишете. В теории, если вы напишете название функции, например public int Fibonacci(int n), то она сразу предложит вам автоматически подставить всё остальное. Конкретно с этим примером система действительно справляется, но в целом впечатления у меня от неё смешанные, и на мой взгляд она пока что не стоит тех $10 в месяц, которые за неё просят после тестового двухмесячного периода. Я уже писал ранее о своём отношении к нейросетям. В задачах дополнения данных они работают средненько: значимый процент решений будет с ошибками. Вот и здесь — сначала я подумал, что Copilot сможет за меня копипастить популярные однотипные куски кода из интернета. Например, я не помню алгоритм Вагнера-Фишера, постоянно его копирую из своих других проектов, часть из которых выложена на Github и наверняка была передана в обучение Copilot. Я предложил нейросетям мне этот алгоритм написать, они написали что-то отдалённо похожее. Внешне выглядело убедительно и даже компилировалось, но работало неправильно, и при ближайшем рассмотрении оказалось, что там просто случайно надёрганные строчки из настоящего алгоритма. Некоторые проверки по 2 раза, а часть нужной логики упущено совсем. Об оформлении кода вообще говорить не стоит: пока всё, что мне выдавалось, оформлено плохо, и на ревью я бы написал разработчику несколько замечаний. Однако, в других местах работает, как задумано. Если у вас есть дуальные функции, оно умеет предлагать дописать остаток (пример на скриншоте ниже). Но из того, что я попробовал, только процентов 20 случаев реально были полезны. Остальные 80% или вообще неверный код, или правильный, но такой неаккуратный, что лучше самому написать. Есть ещё проблема: массовый копипаст довольно опасен, потому что легко пропустить какую-то мелочь. В идеале нужно весь вставленный код проверять построчно, но по когнитивной нагрузке это близко к тому, чтобы создать его самостоятельно. И человеческое внимание совершенно точно будет расслабляться и размываться при работе с такими средствами автодополнения, а, значит, неизбежны ошибки. На месте чувствительной к багам энтерпрайз-разработки я бы вообще запрещал бы своим сотрудникам применять Copilot. С другой стороны, возможно, подобная утилита хорошо зайдёт для прототипирования, на хакатонах, на стримах с демонстрацией разработки чего-нибудь. У меня будет возможность проверить на соревновании через месяц, но в работе скорее всего отключу. #dev

Hashtags

#dev

Резултати

Намерени 1 подобни публикации

Търсене: #agentskills

当前筛选 #agentskills清除筛选

AI一线｜ShareCentre

@ShareCentre · Post #7129 · 26.03.2026 г., 07:45

Намери подобни Прегледай

Google DeepMind 发布 Gemini API 开发者技能：用 Agent Skills 弥合模型知识鸿沟 Google DeepMind 于 3 月 25 日发文介绍其构建的 Gemini API 开发者技能（gemini-api-dev），旨在通过 Agent Skills 规范弥合大语言模型的知识鸿沟。测试显示，Gemini 3 系列模型在启用该技能后，代码生成正确率从不足 7% 大幅提升至接近 100%，但前提是模型需具备强大的推理能力。 ⚙️ 技能内容该技能包含四部分： - API 高级功能集概览 - 当前模型和各语言 SDK 说明 - 各 SDK 基础示例代码 - 文档入口点列表（作为真实信息源）技能已开源在 GitHub，支持通过 Vercel skills 和 Context7 两种方式安装： npx skills add google-gemini/gemini-skills --skill gemini-api-dev --global npx ctx7 skills install /google-gemini/gemini-skills gemini-api-dev 📊 评测结果 - 评测集：117 个 prompt，覆盖 Agent 编码、聊天机器人、文档处理、流式内容等场景 - 失败标准：生成的代码使用了旧版 SDK - Gemini 3.0 Pro/Flash：基线仅 6.8%，启用技能后大幅提升 - Gemini 3.1 Pro：基线 28%，启用技能后几乎全部通过 - Gemini 2.5 系列：也有提升，但远不如 3.x 系列——强推理能力是关键 - SDK Usage 类别通过率最低（95%），部分失败来自明确要求使用 Gemini 2.0 模型的 prompt 📎 相关链接原文：https://developers.googleblog.com/closing-the-knowledge-gap-with-agent-skills/ GitHub：https://github.com/google-gemini/gemini-skills Agent Skills 规范：https://agentskills.io Google ADK Skills 文档：https://google.github.io/adk-docs/skills/ #Google#AI#AgentSkills#GeminiAPI#ADK#开发者工具

Hashtags

#google #ai #agentskills #geminiapi #adk #开发者工具