AI 的万亿级机遇:上下文图谱「Rosseta」
- 发布于 2025 年 12 月 22 日
- 作者:Jaya Gupta 和 Ashu Garg
上一代企业软件通过成为“记录系统”(Systems of Record),创造了一个万亿美元级的生态系统。Salesforce 掌握客户数据,Workday 掌握员工数据,SAP 掌握运营数据。只要掌控了权威数据,就掌控了工作流,也就掌控了客户锁定(lock-in)。
当前的争论焦点在于,这些系统能否在向智能体(Agents)转型的过程中幸存下来。Jamin Ball 最近的文章《记录系统万岁》(Long Live Systems of Record)触动了行业的神经。他反驳了“智能体将扼杀一切”的论调,认为智能体并不会取代记录系统,而是提高了优秀记录系统的标准。
我们同意这一观点。智能体是跨系统的且以行动为导向的。工作的用户体验(UX)正在与底层数据平面分离。智能体成为了界面,但底层仍然需要某种权威性的支撑。
但我们更进一步认为:Ball 的观点假设智能体所需的数据已经存在于某处,智能体只需要更好的访问权限、更好的治理、语义契约以及明确的规则来决定何种定义适用于何种目的。
但这只是图景的一半。另一半是目前真正维持企业运转的缺失层:决策轨迹(decision traces)——那些目前存在于 Slack 讨论串、交易审批台(deal desk)对话、升级电话会议以及人们头脑中的例外情况、人工干预、先例和跨系统上下文。
这才是关键的区别所在:
- 规则(Rules) 告诉智能体一般情况下应该发生什么(例如:“使用官方 ARR 进行报告”)。
- 决策轨迹(Decision traces) 记录了这个具体案例中发生了什么(例如:“我们在 v3.2 政策下使用了 X 定义,经过副总裁特批,基于 Z 先例,这是我们所做的更改”)。
智能体不仅需要规则。它们还需要访问决策轨迹,以了解过去是如何应用规则的、哪里批准了例外、冲突是如何解决的、谁批准了什么,以及哪些先例实际上主导着现实。
这正是“智能体系统”(systems of agents)类初创公司拥有结构性优势的地方。它们处于执行路径中。它们在决策时刻能看到完整的上下文:跨系统收集了哪些输入、评估了什么政策、调用了哪条例外路径、谁进行了批准,以及写入了什么状态。如果你将这些轨迹持久化保存,你将得到大多数企业今天并不存在的东西:一个可查询的决策制定记录。
我们将由这些轨迹累积而成的结构称为上下文图谱(Context Graph):它不是“模型的思维链(chain-of-thought)”,而是一个跨越实体和时间缝合而成的活生生的决策轨迹记录,使得“先例”变得可搜索。随着时间的推移,这个上下文图谱将成为自动化真正的事实来源(Source of Truth)——因为它不仅解释了发生了什么,还解释了为什么允许它发生。
核心问题不在于现有的记录系统是否会幸存。而在于是否会出现全新的记录系统——不仅仅是对象的记录系统,而是决策的记录系统——以及这些系统是否会成为下一个万亿美元级的平台。
记录系统未能捕捉的内容
智能体正在进入实际的工作流程——合同审查、报价到回款(quote-to-cash)、客服解决——团队正撞上一堵仅靠治理无法解决的墙。
这堵墙不是因为缺失数据,而是缺失决策轨迹。智能体遇到了人类每天用判断力和组织记忆来解决的同样的模糊性。但这些判断的输入并没有作为持久的工件存储下来。具体来说:
- 存在于人们头脑中的例外逻辑。 “我们要给医疗保健公司额外 10% 的折扣,因为他们的采购周期太残酷了。”这不在 CRM 里。这是通过入职培训和私下交谈传递的部落知识(tribal knowledge)。
- 过去决策的先例。 “我们上个季度为 X 公司构建了类似的交易结构——我们要保持一致。”没有任何系统将这两笔交易联系起来,也没有记录为什么选择了这种结构。
- 跨系统综合。 客服主管在 Salesforce 中检查客户的 ARR,在 Zendesk 中看到两个未解决的升级工单,读到一个标记流失风险的 Slack 讨论串,然后决定升级处理。这种综合发生在他们的脑海中。工单上只写着“升级到 Tier 3”。
- 发生在系统之外的审批链。 副总裁在 Zoom 通话或 Slack 私信中批准了折扣。商机记录显示了最终价格,但没有显示是谁批准了偏差或原因。
这就是“从未被捕捉”的含义。不是数据脏乱或孤立,而是连接数据与行动的推理过程从未被视为数据。
上下文图谱是持久层
当初创公司通过仪器化智能体编排层,在每次运行时发出决策轨迹,它们就获得了一种企业今天几乎从未拥有的东西:结构化的、可重放的历史记录,展示上下文是如何转化为行动的。
实际上这看起来像什么?一个续约智能体提议 20% 的折扣。政策规定续约折扣上限为 10%,除非批准了服务影响例外。智能体从 PagerDuty 拉取了三个 SEV-1 级事故,在 Zendesk 中拉取了一个未解决的“除非修复否则取消”的升级工单,以及上个季度副总裁批准类似例外的过往续约讨论串。它将例外路由给财务部门。财务批准。CRM 最终只记录了一个事实:“20% 折扣”。
一旦你有了决策记录,“为什么”就成了一等公民数据。随着时间的推移,这些记录自然形成了一个上下文图谱:企业已经关心的实体(账户、续约、工单、事故、政策、审批人、智能体运行记录)通过决策事件(关键时刻)和“为什么”的链接连接起来。公司现在可以审计和调试自动化,并将例外转化为先例,而不是每个季度都在 Slack 中重新学习相同的边缘案例。
反馈循环是使其产生复利效应的关键。捕捉到的决策轨迹变成了可搜索的先例。每一个自动化的决策都向图谱添加了另一条轨迹。
这并不需要在第一天就实现完全自动化。它从“人在回路”(human-in-the-loop)开始:智能体提议、收集上下文、路由审批并记录轨迹。随着时间的推移,随着类似案例的重复,路径的更多部分可以被自动化,因为系统拥有一个结构化的过往决策和例外库。即使仍然由人类做决定,图谱也在不断增长,因为工作流层将输入、批准和理由捕捉为持久的先例,而不是让它在 Slack 中消失。
为什么老牌巨头无法构建上下文图谱
Ball 乐观地认为,现有玩家会演变为这种架构。数据仓库变成“真相注册表”(truth registries),而 CRM 变成“带 API 的状态机”。他描述的是一个进化而非替代的故事。
这对于让现有数据更易于访问可能行得通。但这对于捕捉决策轨迹行不通。
运营类的老牌巨头是孤立的,且优先考虑当前状态。
Salesforce 正在推行 Agentforce,ServiceNow 有 Now Assist,Workday 正在构建 HR 智能体。他们的推销语是“我们拥有数据,现在我们加上智能”。
但这些智能体继承了其母体的架构限制。Salesforce 建立在当前状态存储之上:它知道商机现在是什么样子,而不是决策做出时是什么样子。当折扣被批准时,证明其合理性的上下文并未被保存。你无法重放决策时的世界状态,这意味着你无法审计决策、从中学习或将其用作先例。
数据仓库玩家面临不同的问题:它们处于读取路径,而不是写入路径。
Ball 将 @Snowflake 和 Databricks 定位为“真相注册表”层。两者都在发力——Snowflake 推出了 Cortex 并收购了 Streamlit,Databricks 收购了 Neon 并推出了 Lakebase 和 AgentBricks。其推销语是:数据平台将取代记录系统,成为 AI 智能体的基础。
数据仓库确实有基于时间的视图。你可以查询历史快照,跟踪指标如何变化,并比较跨时期的状态。但数据仓库是在决策做出后通过 ETL 接收数据的。等到数据落入 Snowflake 时,决策上下文已经消失了。
一个只能在事后看到“读”操作的系统,无法成为决策血缘(decision lineage)的记录系统。它可以告诉你发生了什么,但它无法告诉你为什么。
Databricks 在将这些拼图整合方面走得更远。但是,靠近智能体构建的地方,并不等同于处于决策发生的执行路径中。
“智能体系统”类初创公司拥有结构性优势:它们处于编排路径中。
当一个智能体对升级进行分类、响应事故或决定折扣时,它从多个系统中提取上下文,评估规则,解决冲突并采取行动。编排层看得到全貌:收集了哪些输入、应用了哪些政策、批准了哪些例外以及原因。因为它正在执行工作流,所以它可以在决策时刻捕捉该上下文——不是通过事后的 ETL,而是在当下作为一等公民记录下来。
这就是上下文图谱,这将是 AI 时代公司最有价值的资产。
老牌巨头会反击。他们会尝试通过收购来通过“螺栓”式的方式外挂编排能力。他们会锁定 API 并采用出口费用(egress fees)使数据提取变得昂贵——这是超大规模云厂商使用过的剧本。他们将构建自己的智能体框架,并推行“把一切都保留在我们的生态系统中”的叙事。
但是,捕捉决策轨迹需要在提交(commit)时刻处于执行路径中,而不是事后外挂治理。老牌巨头可以让数据提取变得更难,但无法将自己插入到一个它们从未参与过的编排层中。
初创公司的三条路径
构建智能体系统的初创公司将走上不同的路径,每条路径都有其权衡。
有些将从第一天起就取代现有的记录系统。 一个围绕智能体执行重建的 CRM 或 ERP,具有事件溯源(event-sourced)状态和原生于架构的政策捕捉。这很难,因为老牌巨头根深蒂固,但在转型时刻这就变得可行。
在众多追逐 AI SDR(销售开发代表)类别的初创公司中,Regie 选择构建一个 AI 原生的销售参与平台,以取代像 Outreach/Salesloft 这样为人类在碎片化工具链中执行序列而设计的传统平台。Regie 专为混合团队设计,其中智能体是一等公民行动者:它可以寻找潜在客户、生成外联、运行跟进、处理路由并升级给人类。
有些将取代模块而不是整个系统。 这些初创公司针对例外和审批集中的特定子工作流,然后成为这些决策的记录系统,同时将最终状态同步回老牌系统。
Maximor 正在金融领域做这件事:自动化现金、结账管理和核心会计工作流,而不拆除总账(GL)。ERP 仍然是分类账,但 Maximor 成为对账逻辑所在的真相来源。
有些将创建全新的记录系统。 这些初创公司从编排层开始,但它们持久化了企业从未系统性存储的东西:决策制定轨迹。随着时间的推移,这种可重放的血缘关系成为权威工件。智能体层不再仅仅是“自动化”,而变成了企业回答“我们为什么那样做?”的地方。
PlayerZero 是这种模式的典范。生产工程(Production engineering)位于 SRE、支持、QA 和开发的交汇处:这是一个经典的“胶水职能”,人类承载着软件无法捕捉的上下文。PlayerZero 从自动化 L2/L3 支持开始,但真正的资产是它构建的上下文图谱:一个关于代码、配置、基础设施和客户行为在现实中如何交互的活模型。该图谱成为“为什么会坏?”和“这各变更会破坏生产环境吗?”的真相来源:这是现有系统无法回答的问题。
随着初创公司追求这些路径,智能体的可观测性将成为关键的基础设施。随着决策轨迹的积累和上下文图谱的增长,企业将需要大规模地监控、调试和评估智能体行为。
Arize 正在为这一新堆栈构建可观测层——让团队能够看到智能体如何推理、在哪里失败以及它们的决策随时间推移的表现如何。就像 Datadog 成为监控应用程序必不可少的基础设施一样,Arize 定位于成为监控和提高智能体决策质量必不可少的基础设施。
给创始人的关键信号
关于在哪里构建的信号是重叠的,但也并非完全相同。
有两个信号适用于所有这三个机会:
- 高人力投入(High headcount)。 如果一家公司有 50 人在手动执行工作流(路由工单、分类请求或在系统之间核对数据),这就是一个信号。劳动力的存在是因为决策逻辑太复杂,无法用传统工具自动化。
- 重例外决策(Exception-heavy decisions)。 常规、确定性的工作流不需要决策血缘:智能体只是执行。有趣的领域在于逻辑复杂、先例重要且“视情况而定”是诚实答案的地方。想想交易审批台(deal desks)、承保、合规审查和升级管理等用例。
有一个信号专门指向新记录系统的机会:
存在于系统交汇处的组织。 收入运营(RevOps)的存在是因为必须有人协调销售、财务、市场营销和客户成功。DevOps 的存在是因为必须有人连接开发、IT 和支持。安全运营(Security Ops)位于 IT、工程和合规之间。
这些“胶水”职能是一个明显的信号(tell)。它们的出现正是因为没有单一的记录系统拥有跨职能的工作流。组织架构图创建了一个角色来承载软件无法捕捉的上下文。
自动化该角色的智能体不仅仅是跑得更快。它可以持久化保存该角色被创建来产生的决策、例外和先例。这就是通往新记录系统的路径:不是通过拆除老牌巨头,而是通过捕捉只有当智能体处于工作流中时才可见的一类真相。
重新构想记录系统
问题不在于记录系统是否会幸存——它们会的。问题在于,下一个万亿美元级的平台是通过向现有数据添加 AI 构建的,还是通过捕捉使数据可行动的决策轨迹构建的。
我们认为是后者。而今天正在构建上下文图谱的初创公司正在奠定这一基础。