AI 的万亿级机遇：上下文图谱「Rosseta」

26 Dec, 2025

发布于 2025 年 12 月 22 日
作者：Jaya Gupta 和 Ashu Garg

上一代企业软件通过成为“记录系统”（Systems of Record），创造了一个万亿美元级的生态系统。Salesforce 掌握客户数据，Workday 掌握员工数据，SAP 掌握运营数据。只要掌控了权威数据，就掌控了工作流，也就掌控了客户锁定（lock-in）。

@ari

当前的争论焦点在于，这些系统能否在向智能体（Agents）转型的过程中幸存下来。Jamin Ball 最近的文章《记录系统万岁》（Long Live Systems of Record）触动了行业的神经。他反驳了“智能体将扼杀一切”的论调，认为智能体并不会取代记录系统，而是提高了优秀记录系统的标准。

我们同意这一观点。智能体是跨系统的且以行动为导向的。工作的用户体验（UX）正在与底层数据平面分离。智能体成为了界面，但底层仍然需要某种权威性的支撑。

但我们更进一步认为：Ball 的观点假设智能体所需的数据已经存在于某处，智能体只需要更好的访问权限、更好的治理、语义契约以及明确的规则来决定何种定义适用于何种目的。

但这只是图景的一半。另一半是目前真正维持企业运转的缺失层：决策轨迹（decision traces）——那些目前存在于 Slack 讨论串、交易审批台（deal desk）对话、升级电话会议以及人们头脑中的例外情况、人工干预、先例和跨系统上下文。

这才是关键的区别所在：

规则（Rules） 告诉智能体一般情况下应该发生什么（例如：“使用官方 ARR 进行报告”）。
决策轨迹（Decision traces） 记录了这个具体案例中发生了什么（例如：“我们在 v3.2 政策下使用了 X 定义，经过副总裁特批，基于 Z 先例，这是我们所做的更改”）。

智能体不仅需要规则。它们还需要访问决策轨迹，以了解过去是如何应用规则的、哪里批准了例外、冲突是如何解决的、谁批准了什么，以及哪些先例实际上主导着现实。

这正是“智能体系统”（systems of agents）类初创公司拥有结构性优势的地方。它们处于执行路径中。它们在决策时刻能看到完整的上下文：跨系统收集了哪些输入、评估了什么政策、调用了哪条例外路径、谁进行了批准，以及写入了什么状态。如果你将这些轨迹持久化保存，你将得到大多数企业今天并不存在的东西：一个可查询的决策制定记录。

我们将由这些轨迹累积而成的结构称为上下文图谱（Context Graph）：它不是“模型的思维链（chain-of-thought）”，而是一个跨越实体和时间缝合而成的活生生的决策轨迹记录，使得“先例”变得可搜索。随着时间的推移，这个上下文图谱将成为自动化真正的事实来源（Source of Truth）——因为它不仅解释了发生了什么，还解释了为什么允许它发生。

核心问题不在于现有的记录系统是否会幸存。而在于是否会出现全新的记录系统——不仅仅是对象的记录系统，而是决策的记录系统——以及这些系统是否会成为下一个万亿美元级的平台。

记录系统未能捕捉的内容

智能体正在进入实际的工作流程——合同审查、报价到回款（quote-to-cash）、客服解决——团队正撞上一堵仅靠治理无法解决的墙。

这堵墙不是因为缺失数据，而是缺失决策轨迹。智能体遇到了人类每天用判断力和组织记忆来解决的同样的模糊性。但这些判断的输入并没有作为持久的工件存储下来。具体来说：

存在于人们头脑中的例外逻辑。 “我们要给医疗保健公司额外 10% 的折扣，因为他们的采购周期太残酷了。”这不在 CRM 里。这是通过入职培训和私下交谈传递的部落知识（tribal knowledge）。
过去决策的先例。 “我们上个季度为 X 公司构建了类似的交易结构——我们要保持一致。”没有任何系统将这两笔交易联系起来，也没有记录为什么选择了这种结构。
跨系统综合。 客服主管在 Salesforce 中检查客户的 ARR，在 Zendesk 中看到两个未解决的升级工单，读到一个标记流失风险的 Slack 讨论串，然后决定升级处理。这种综合发生在他们的脑海中。工单上只写着“升级到 Tier 3”。
发生在系统之外的审批链。 副总裁在 Zoom 通话或 Slack 私信中批准了折扣。商机记录显示了最终价格，但没有显示是谁批准了偏差或原因。

这就是“从未被捕捉”的含义。不是数据脏乱或孤立，而是连接数据与行动的推理过程从未被视为数据。

上下文图谱是持久层

当初创公司通过仪器化智能体编排层，在每次运行时发出决策轨迹，它们就获得了一种企业今天几乎从未拥有的东西：结构化的、可重放的历史记录，展示上下文是如何转化为行动的。

实际上这看起来像什么？一个续约智能体提议 20% 的折扣。政策规定续约折扣上限为 10%，除非批准了服务影响例外。智能体从 PagerDuty 拉取了三个 SEV-1 级事故，在 Zendesk 中拉取了一个未解决的“除非修复否则取消”的升级工单，以及上个季度副总裁批准类似例外的过往续约讨论串。它将例外路由给财务部门。财务批准。CRM 最终只记录了一个事实：“20% 折扣”。

一旦你有了决策记录，“为什么”就成了一等公民数据。随着时间的推移，这些记录自然形成了一个上下文图谱：企业已经关心的实体（账户、续约、工单、事故、政策、审批人、智能体运行记录）通过决策事件（关键时刻）和“为什么”的链接连接起来。公司现在可以审计和调试自动化，并将例外转化为先例，而不是每个季度都在 Slack 中重新学习相同的边缘案例。

反馈循环是使其产生复利效应的关键。捕捉到的决策轨迹变成了可搜索的先例。每一个自动化的决策都向图谱添加了另一条轨迹。

这并不需要在第一天就实现完全自动化。它从“人在回路”（human-in-the-loop）开始：智能体提议、收集上下文、路由审批并记录轨迹。随着时间的推移，随着类似案例的重复，路径的更多部分可以被自动化，因为系统拥有一个结构化的过往决策和例外库。即使仍然由人类做决定，图谱也在不断增长，因为工作流层将输入、批准和理由捕捉为持久的先例，而不是让它在 Slack 中消失。

为什么老牌巨头无法构建上下文图谱

Ball 乐观地认为，现有玩家会演变为这种架构。数据仓库变成“真相注册表”（truth registries），而 CRM 变成“带 API 的状态机”。他描述的是一个进化而非替代的故事。

这对于让现有数据更易于访问可能行得通。但这对于捕捉决策轨迹行不通。

运营类的老牌巨头是孤立的，且优先考虑当前状态。

Salesforce 正在推行 Agentforce，ServiceNow 有 Now Assist，Workday 正在构建 HR 智能体。他们的推销语是“我们拥有数据，现在我们加上智能”。

但这些智能体继承了其母体的架构限制。Salesforce 建立在当前状态存储之上：它知道商机现在是什么样子，而不是决策做出时是什么样子。当折扣被批准时，证明其合理性的上下文并未被保存。你无法重放决策时的世界状态，这意味着你无法审计决策、从中学习或将其用作先例。

数据仓库玩家面临不同的问题：它们处于读取路径，而不是写入路径。

Ball 将 @Snowflake 和 Databricks 定位为“真相注册表”层。两者都在发力——Snowflake 推出了 Cortex 并收购了 Streamlit，Databricks 收购了 Neon 并推出了 Lakebase 和 AgentBricks。其推销语是：数据平台将取代记录系统，成为 AI 智能体的基础。

数据仓库确实有基于时间的视图。你可以查询历史快照，跟踪指标如何变化，并比较跨时期的状态。但数据仓库是在决策做出后通过 ETL 接收数据的。等到数据落入 Snowflake 时，决策上下文已经消失了。

一个只能在事后看到“读”操作的系统，无法成为决策血缘（decision lineage）的记录系统。它可以告诉你发生了什么，但它无法告诉你为什么。

Databricks 在将这些拼图整合方面走得更远。但是，靠近智能体构建的地方，并不等同于处于决策发生的执行路径中。

“智能体系统”类初创公司拥有结构性优势：它们处于编排路径中。

当一个智能体对升级进行分类、响应事故或决定折扣时，它从多个系统中提取上下文，评估规则，解决冲突并采取行动。编排层看得到全貌：收集了哪些输入、应用了哪些政策、批准了哪些例外以及原因。因为它正在执行工作流，所以它可以在决策时刻捕捉该上下文——不是通过事后的 ETL，而是在当下作为一等公民记录下来。

这就是上下文图谱，这将是 AI 时代公司最有价值的资产。

老牌巨头会反击。他们会尝试通过收购来通过“螺栓”式的方式外挂编排能力。他们会锁定 API 并采用出口费用（egress fees）使数据提取变得昂贵——这是超大规模云厂商使用过的剧本。他们将构建自己的智能体框架，并推行“把一切都保留在我们的生态系统中”的叙事。

但是，捕捉决策轨迹需要在提交（commit）时刻处于执行路径中，而不是事后外挂治理。老牌巨头可以让数据提取变得更难，但无法将自己插入到一个它们从未参与过的编排层中。

初创公司的三条路径

构建智能体系统的初创公司将走上不同的路径，每条路径都有其权衡。

有些将从第一天起就取代现有的记录系统。 一个围绕智能体执行重建的 CRM 或 ERP，具有事件溯源（event-sourced）状态和原生于架构的政策捕捉。这很难，因为老牌巨头根深蒂固，但在转型时刻这就变得可行。

在众多追逐 AI SDR（销售开发代表）类别的初创公司中，Regie 选择构建一个 AI 原生的销售参与平台，以取代像 Outreach/Salesloft 这样为人类在碎片化工具链中执行序列而设计的传统平台。Regie 专为混合团队设计，其中智能体是一等公民行动者：它可以寻找潜在客户、生成外联、运行跟进、处理路由并升级给人类。

有些将取代模块而不是整个系统。 这些初创公司针对例外和审批集中的特定子工作流，然后成为这些决策的记录系统，同时将最终状态同步回老牌系统。

Maximor 正在金融领域做这件事：自动化现金、结账管理和核心会计工作流，而不拆除总账（GL）。ERP 仍然是分类账，但 Maximor 成为对账逻辑所在的真相来源。

有些将创建全新的记录系统。 这些初创公司从编排层开始，但它们持久化了企业从未系统性存储的东西：决策制定轨迹。随着时间的推移，这种可重放的血缘关系成为权威工件。智能体层不再仅仅是“自动化”，而变成了企业回答“我们为什么那样做？”的地方。

PlayerZero 是这种模式的典范。生产工程（Production engineering）位于 SRE、支持、QA 和开发的交汇处：这是一个经典的“胶水职能”，人类承载着软件无法捕捉的上下文。PlayerZero 从自动化 L2/L3 支持开始，但真正的资产是它构建的上下文图谱：一个关于代码、配置、基础设施和客户行为在现实中如何交互的活模型。该图谱成为“为什么会坏？”和“这各变更会破坏生产环境吗？”的真相来源：这是现有系统无法回答的问题。

随着初创公司追求这些路径，智能体的可观测性将成为关键的基础设施。随着决策轨迹的积累和上下文图谱的增长，企业将需要大规模地监控、调试和评估智能体行为。

Arize 正在为这一新堆栈构建可观测层——让团队能够看到智能体如何推理、在哪里失败以及它们的决策随时间推移的表现如何。就像 Datadog 成为监控应用程序必不可少的基础设施一样，Arize 定位于成为监控和提高智能体决策质量必不可少的基础设施。

给创始人的关键信号

关于在哪里构建的信号是重叠的，但也并非完全相同。

有两个信号适用于所有这三个机会：

高人力投入（High headcount）。 如果一家公司有 50 人在手动执行工作流（路由工单、分类请求或在系统之间核对数据），这就是一个信号。劳动力的存在是因为决策逻辑太复杂，无法用传统工具自动化。
重例外决策（Exception-heavy decisions）。 常规、确定性的工作流不需要决策血缘：智能体只是执行。有趣的领域在于逻辑复杂、先例重要且“视情况而定”是诚实答案的地方。想想交易审批台（deal desks）、承保、合规审查和升级管理等用例。

有一个信号专门指向新记录系统的机会：

存在于系统交汇处的组织。 收入运营（RevOps）的存在是因为必须有人协调销售、财务、市场营销和客户成功。DevOps 的存在是因为必须有人连接开发、IT 和支持。安全运营（Security Ops）位于 IT、工程和合规之间。

这些“胶水”职能是一个明显的信号（tell）。它们的出现正是因为没有单一的记录系统拥有跨职能的工作流。组织架构图创建了一个角色来承载软件无法捕捉的上下文。

自动化该角色的智能体不仅仅是跑得更快。它可以持久化保存该角色被创建来产生的决策、例外和先例。这就是通往新记录系统的路径：不是通过拆除老牌巨头，而是通过捕捉只有当智能体处于工作流中时才可见的一类真相。

重新构想记录系统

问题不在于记录系统是否会幸存——它们会的。问题在于，下一个万亿美元级的平台是通过向现有数据添加 AI 构建的，还是通过捕捉使数据可行动的决策轨迹构建的。

我们认为是后者。而今天正在构建上下文图谱的初创公司正在奠定这一基础。