持续八周用 agent 写生产级代码，Sentry 工程师 David Cram

持续八周用 agent 写生产级代码，Sentry 工程师 David Cramer 的深刻经验总结：

• 先进的 agent 可快速完成简单任务（shell 脚本、模板代码），但这仅占实际工作量不到10%。

• 长期使用难以保持稳定，agent 表现波动，容易陷入“让 agent 正确执行”的死循环。

• 交互式 TUI（如 Claude Code）对复杂任务有帮助，但功能性和可维护性软件离不开人类介入和增量审查。

• 顶尖工具变化快但不至于频繁更替，8周后依然依赖 Cursor 和 Claude Code。

• 上下文管理极具挑战，传递明确上下文仍是最佳方案。

• 复杂任务需将 prompts 与脚本结合，单靠 prompts 难以保证正确性和可靠性，如“创建 PR”。

• 纯 headless agent 目前还不够成熟，反馈周期长且效果有限，不能满足真实世界需求。

• 适应这些工具的日常使用很重要，理解上下文管理、工作流和工具调用方式将带来更大价值。

• 代码架构扁平化、降低上下文依赖能显著提升 agent 产出效果。

• 与社区反馈一致，agent 在大型代码库中难以防止无关破坏，持续的人类监督不可或缺。

总结：当前 agent 还未达到全自动替代人类开发的阶段，理智结合人工审查与结构化工具，才能发挥最大效用。

详见完整讨论及互动 👉 x.com/zeeg/status/1950299260060389764

人工智能软件开发代码自动化 Sentry LLM 智能代理

世良情感网