指数级 AI 时代的产品管理

April 01, 2026

指数级 AI 时代的产品管理

作者: Cat Wu，Anthropic Claude Code 产品负责人

自 2024 年 10 月 Claude Sonnet 3.5 (new) 发布以来，我养成了一个习惯：每次新模型发布，就用 Claude Code（当时还是内部工具）测试让它给 Excalidraw 添加表格功能。每次新模型，Claude 都能前进一小步，但始终失败。

然后，2025 年 6 月 Opus 4 发布，Claude 开始偶尔成功了——成功次数足够多，我们把这次练习做成了预录 demo，在 Claude 4 发布会上展示最新模型能做到什么。

不到一年后，Opus 4.6 已经能可靠地一次性完成 Excalidraw 功能请求，可靠到我们敢在数千名专业开发者面前现场演示。

模型进步的速度不断扩展着可能性的边界。传统产品管理的底层假设是：项目开始时技术能做什么，项目结束时大概还是那些。产品经理会在前期收集足够信息，对未来做出有信心的押注，然后按计划执行数月。

指数级进化的模型打破了这个假设。 你设计时围绕的限制可能在项目中途消失。你脚下的土地正在上升，团队需要围绕这个现实重新组织。新的产品管理节奏是：快速实验、持续交付、在有效的地方加倍投入。

作为 Anthropic 的产品经理，我最常被问到的问题之一就是：我们的角色正在如何变化？以下是我学到的东西。

我与 Claude Code 的产品管理之旅

我的职业生涯始于 Scale AI 和 Dagster 等初创公司的产品工程师，后来成为风险投资人——在那个角色里我仍然写代码，用来自动化工作中繁琐的部分，比如扫描 X 平台上的新公司公告，或检测开源项目何时开始获得关注。

2024 年 8 月，我加入 Anthropic，成为 Research PM 团队的产品经理，这个团队连接我们的研究团队和真实客户，以交付更好的模型。那年秋天 Claude Code 在内部可用时，我用它加速工作中偏手动的部分，包括构建 Streamlit 应用来分析大规模用户反馈，运行 evals 帮助公司找到可信的新基准测试。低门槛的构建也意味着我可以探索远超常规角色的领域，比如创建 RL 环境来更好理解训练。

这些项目花了数百小时的 Claude Code 提示，但没有一行代码是手写的。

设计新的产品管理工作流

像 Claude Code 和 Cowork 这样的工具正在模糊产品开发生命周期中不同角色的界限。Claude Code 不是唯一支撑我工作流的工具。随着时间推移，我在三个产品间形成了自然的分工：聊天协作者（Claude.ai）、Agent 编码工具（Claude Code）、知识工作工具（Cowork）。

工具	用途
Claude.ai	把 Claude 当作思维伙伴对话，不需要它采取行动。讨论策略文档、处理棘手情况、获取快速答案
Claude Code	构建原型、evals 和脚本，很多会调用 Claude API。输出是代码时使用
Cowork	做其他所有事：清空收件箱、跟踪和执行待办清单、创建幻灯片、搜索 Slack 理解决策历史、预订出差

我与行业各地的产品经理交流过，他们找到了自己版本的这种工作流：

“Claude 提高了优秀产品团队能构建的上限，大大缩短了从想法到原型的距离。以前要花几周构建才能给客户看到的东西，现在我从 Claude Cowork 开始，拉取 Slack、代码库和文档的上下文，然后转到 Claude Code，几小时就能做出可 demo 的东西。优秀的产品团队一直在用真实客户测试想法，这个直觉没变。变的是我们能把这个循环跑在多少高质量想法上。” — Bihan Jiang，Decagon 产品总监

“对我来说，AI 原生世界的 PM 既要有创意又要学术。每个新模型发布都会改变可能性，在构建 Datadog 的 Bits AI SRE agent 时，我们通过真实生产事故的离线评估来研究它的优势和失败模式。我们还设计紧密的反馈循环，优化 UX 来暴露 agent 的困难点，把这些洞察转化为产品改进。从这个意义上说，PM 的手艺已经从’前期定义确定性’转变为’加速发现’。” — Kai Xin Tai，Datadog 高级产品经理

作为今天的产品经理，最令人兴奋的事情之一是这些工作流在不断演进，给我们更多杠杆。

拥抱 AI 指数级增长

METR 研究发现，Opus 4.6 大约有一半的时候能完成人类需要近 12 小时的软件任务。当我们刚开始构建 Claude Code 时，Sonnet 3.5 (new) 是前沿模型，METR 测量它能完成人类大约 21 分钟的任务。16 个月内大约 41 倍的跃升。

Claude Code 团队已经进化以跟上模型改进的速度。我们的角色正在融合：设计师交付代码，工程师做产品决策，产品经理构建原型和 evals。这之所以可行，是因为清晰的策略和目标让每个人都能自主优先排序。产品经理的工作是在快速模型进步创造的模糊中带来清晰，推动团队对可能性想得更大，清理更快交付的路径。

以下是我们拥抱的四个转变：

1. 用短冲刺规划

传统产品经理思维把探索当作路线图锁定前发生的事情。你做研究，写 PRD，然后交给工程团队构建。

我们不再用长期路线图，而是鼓励团队每个人（工程师、产品经理、设计师）去接"支线任务"。支线任务是你跑在正式路线图之外的短期自主实验——花一下午原型一个想法，测试一个你以为遥不可及的能力，或者只是看看把模型推到极限会发生什么。

Anthropic 一些最受欢迎的功能——Claude Code Desktop、AskUserQuestion tool、todo lists——都是这样诞生的。

2. 鼓励 demo 和 eval，而不是文档

我们的团队很大程度上用"原型优先"思维取代了"文档优先"思维。不再举办传统站会，而是分享新想法的 demo。内部用户试用，真正有参与感的会被打磨并更广泛分享。因为你可以一下午原型一个想法，获得真实用户反馈，然后迭代或放弃，我们避免了在没人想要的功能上浪费工程时间。

Evals 也扮演类似角色。我们不再猜测模型能否可靠执行某个行为，而是构建 eval 来测量。这把抽象的产品辩论变成具体的实验。

3. 给团队无限 token（先学习，后优化成本）

当模型能力快速变化时，最稀缺的资源是学习速度，而不是 token 成本。

在 Claude Code，我们鼓励团队使用最强大的模型（目前是 Opus 4.6），即使它更贵。我们有个工程师一个月用了超过 5000 万 token——大约 2500 美元——但他的产出远超这个成本。给团队慷慨的 token 访问权限让他们能学习什么可行、什么不可行。当某个工作流被验证后，我们再优化成本，也许用更便宜的模型或缓存。

先验证功能是否可能，再考虑成本优化。

4. 做简单的事

在 Anthropic，我们有一个贯穿每个团队的指导原则：做有效的简单事。

如果你的产品巧妙地绕过了某个模型限制，当下一个模型发布时，那个绕过就成了不必要的复杂性。这就是为什么"做简单的事"很重要：实现越简单，新能力到来时越容易替换。

当我们首次在 Claude Code 发布 todo list 时，模型不能可靠地在完成任务后打勾。所以我们每隔几条消息添加系统提醒，定期推动 agent 更新自己的 todo list。这有效，但这是个 hack。下一个模型，这个行为自然就有了，我们完全移除了提醒。我们反复看到这个模式：我们的系统提示和工具描述曾经重度工程化以补偿模型限制，我们每个模型都在削减提示，包括 Opus 4.6 减少了 20%。

展望未来

许多产品经理习惯对完整产品体验有紧密控制，但 AI 推动你放手以快速行动。构建 AI 产品感觉像冲浪，最重要的是留在浪上。作为完美主义者，这是我最难适应的转变，但产品经理的角色现在是识别少数真正不可妥协的事情，其他的放手。

这些转变的净效果是产品团队可以显著更快。当产品经理能在一下午从想法走到可工作的原型，“如果我们试试……“和"来，试试这个"之间的差距几乎消失了。

在 Anthropic，产品经理不是唯一用 Claude 改变工作流的人。我们的数据科学、财务、营销、法务和设计团队都自己学会了这些工具。整个组织以相同速度前进，不再等待交接。

PM 角色现在是同时追踪两件事：AI 如何改变你的工作方式，以及它如何改变你产品中的可能性。 做好这一点，你就不会在表格工具终于工作时感到惊讶——你是预见它到来的人。

开始用 Claude Code 构建更好的产品

作者: Cat Wu，Anthropic Claude Code 产品负责人 | X | LinkedIn