世良情感网

持续八周用 agent 写生产级代码,Sentry 工程师 David Cram

持续八周用 agent 写生产级代码,Sentry 工程师 David Cramer 的深刻经验总结:

• 先进的 agent 可快速完成简单任务(shell 脚本、模板代码),但这仅占实际工作量不到10%。

• 长期使用难以保持稳定,agent 表现波动,容易陷入“让 agent 正确执行”的死循环。

• 交互式 TUI(如 Claude Code)对复杂任务有帮助,但功能性和可维护性软件离不开人类介入和增量审查。

• 顶尖工具变化快但不至于频繁更替,8周后依然依赖 Cursor 和 Claude Code。

• 上下文管理极具挑战,传递明确上下文仍是最佳方案。

• 复杂任务需将 prompts 与脚本结合,单靠 prompts 难以保证正确性和可靠性,如“创建 PR”。

• 纯 headless agent 目前还不够成熟,反馈周期长且效果有限,不能满足真实世界需求。

• 适应这些工具的日常使用很重要,理解上下文管理、工作流和工具调用方式将带来更大价值。

• 代码架构扁平化、降低上下文依赖能显著提升 agent 产出效果。

• 与社区反馈一致,agent 在大型代码库中难以防止无关破坏,持续的人类监督不可或缺。

总结:当前 agent 还未达到全自动替代人类开发的阶段,理智结合人工审查与结构化工具,才能发挥最大效用。

详见完整讨论及互动 👉 x.com/zeeg/status/1950299260060389764

人工智能 软件开发 代码自动化 Sentry LLM 智能代理