Claude 4.5 新特性「Anthropic官方」

Claude 4.5 推出了三款针对不同用例设计的模型:
- Claude Opus 4.5:我们最智能的模型,结合了极致的能力与实用的性能。非常适合复杂的专业任务、专业软件工程和高级智能体。价格比之前的 Opus 模型更亲民。
- Claude Sonnet 4.5:我们用于复杂智能体和编程的最佳模型,在大多数任务中拥有最高智力水平。
- Claude Haiku 4.5:我们最快且最智能的 Haiku 模型,具有接近前沿的性能。这也是首个支持扩展思维(extended thinking)的 Haiku 模型。
Opus 4.5 相比 Opus 4.1 的主要改进
极致智力
Claude Opus 4.5 代表了我们最智能的模型,结合了极致的能力与实用的性能。它在推理、编程和复杂问题解决任务上实现了阶梯式的提升,同时保持了 Opus 系列一贯的高质量输出。
Effort 参数
Claude Opus 4.5 是唯一支持 Effort 参数的模型,允许您控制 Claude 在响应时使用的 Token 数量。这使您能够通过单个模型在回复的详尽程度和 Token 效率之间进行权衡。
Effort 参数会影响响应中的所有 Token,包括文本回复、工具调用和扩展思维。您可以选择:
- High effort(高):最大程度的详尽性,适用于复杂的分析和详细的解释。
- Medium effort(中):平衡的方法,适用于大多数生产用例。
- Low effort(低):最节省 Token 的响应,适用于大批量自动化任务。
卓越的计算机使用能力
Claude Opus 4.5 引入了增强的计算机使用能力,新增了缩放(zoom)操作,能够以全分辨率详细检查特定的屏幕区域。这使得 Claude 能够检查在标准截图中可能不清楚的细微 UI 元素、小字体文本和详细的视觉信息。
缩放功能在以下方面特别有价值:
- 检查微小的 UI 元素和控件
- 阅读精细的印刷品或详细文本
- 分析信息密集的复杂界面
- 在采取行动前验证精确的视觉细节
实用性能
Claude Opus 4.5 以比之前的 Opus 模型更亲民的价格提供旗舰级的智力,使先进的 AI 能力能够应用于更广泛的应用程序和用例。
思维块保留
Claude Opus 4.5 自动保留所有之前的思维块贯穿整个对话,在扩展的多轮交互和工具使用会话中保持推理的连续性。这确保了 Claude 在处理复杂的、长期运行的任务时,可以有效利用其完整的推理历史。
Sonnet 4.5 相比 Sonnet 4 的主要改进
卓越的编程能力
Claude Sonnet 4.5 是我们需要迄今为止最好的编程模型,在整个开发生命周期中都有显著改进:
- SWE-bench Verified 表现:在编程基准测试中达到先进的最前沿水平
- 增强的规划和系统设计:更好的架构决策和代码组织
- 改进的安全工程:更稳健的安全实践和漏洞检测
- 更好的指令遵循:更精确地遵守编程规范和要求
当启用扩展思维时,Claude Sonnet 4.5 在编程任务上的表现显著更好。扩展思维默认是禁用的,但我们建议在进行复杂的编程工作时启用它。请注意,扩展思维会影响 Prompt 缓存效率。有关配置详情,请参阅迁移指南。
智能体能力
Claude Sonnet 4.5 在智能体能力方面引入了重大进展:
- 扩展的自主操作:Sonnet 4.5 可以独立工作数小时,同时保持清晰度和对渐进式进展的专注。该模型一次稳步推进少量任务,而不是试图一次性完成所有任务。它提供基于事实的进度更新,准确反映已完成的工作。
- 上下文感知:Claude 现在会在整个对话过程中追踪其 Token 使用情况,并在每次工具调用后接收更新。这种感知能力有助于防止过早放弃任务,并使其能在长期运行的任务中更有效地执行。有关技术细节,请参阅上下文感知和Prompt 指南。
- 增强的工具使用:该模型更有效地使用并行工具调用,在研究期间同时发起多个推测性搜索,并一次读取多个文件以更快地构建上下文。通过改进跨多个工具和信息源的协调能力,使模型能够在智能体搜索和编程工作流中有效利用广泛的能力。
- 高级上下文管理:Sonnet 4.5 在外部文件中保持出色的状态追踪,在跨会话中保持目标导向。结合更有效的上下文窗口使用和我们新的上下文管理 API 功能,该模型可以优化处理跨扩展会话的信息,以随时间推移保持连贯性。
Claude Sonnet 4.5 拥有一种改进的沟通方式,即简洁、直接且自然。它提供基于事实的进度更新,并且可能会在工具调用后跳过冗长的总结以保持工作流的势头(尽管可以通过 Prompt 调整这一点)。
有关使用此沟通风格的详细指导,请参阅 Claude 4 最佳实践。
创意内容生成
Claude Sonnet 4.5 在创意内容任务方面表现出色:
- 演示文稿和动画:在创建幻灯片和视觉内容方面,匹敌或超过 Claude Opus 4.1 和 Opus 4.5
- 创意才华:生成润色过的、专业的内容,并具有很强的指令遵循能力
- 初次尝试质量:在初次尝试中即可生成可用的、设计良好的内容
Haiku 4.5 相比 Haiku 3.5 的主要改进
Claude Haiku 4.5 代表了 Haiku 模型系列的变革性飞跃,为我们最快的模型类别带来了前沿能力:
极速且接近前沿的智力
Claude Haiku 4.5 以更低的成本和更快的速度提供了与 Sonnet 4 相当的接近前沿的性能:
- 接近前沿的智力:在推理、编程和复杂任务上匹敌 Sonnet 4 的性能
- 增强的速度:速度是 Sonnet 4 的两倍以上,并针对每秒输出 Token 数 (OTPS) 进行了优化
- 最佳的性价比:以三分之一的成本提供接近前沿的智力,非常适合大批量部署
扩展思维能力
Claude Haiku 4.5 是首个支持扩展思维的 Haiku 模型,为 Haiku 系列带来了高级推理能力:
- 极速推理:访问 Claude 的内部推理过程以解决复杂问题
- 思维摘要:为生产级部署提供摘要式的思维输出
- 穿插思维:在工具调用之间进行思考,以实现更复杂的多步骤工作流
- 预算控制:配置思维 Token 预算,以平衡推理深度与速度
必须通过在 API 请求中添加 thinking 参数来显式启用扩展思维。有关实现细节,请参阅扩展思维文档。
当启用扩展思维时,Claude Haiku 4.5 在编程和推理任务上的表现显著更好。扩展思维默认是禁用的,但我们建议在处理复杂问题解决、编程工作和多步推理时启用它。请注意,扩展思维会影响 Prompt 缓存效率。有关配置详情,请参阅迁移指南。
上下文感知
Claude Haiku 4.5 具有上下文感知功能,使模型能够在整个对话过程中追踪其剩余的上下文窗口:
- Token 预算追踪:Claude 在每次工具调用后收到关于剩余上下文容量的实时更新
- 更好的任务持久性:通过了解可用的工作空间,模型可以更有效地执行任务
- 多上下文窗口工作流:改进了跨扩展会话的状态转换处理
这是首个具有原生上下文感知能力的 Haiku 模型。有关 Prompt 指南,请参阅 Claude 4 最佳实践。
强大的编程和工具使用
Claude Haiku 4.5 提供了现代 Claude 模型所期望的强大编程能力:
- 编程熟练度:在代码生成、调试和重构任务上表现出色
- 全工具支持:兼容所有 Claude 4 工具,包括 bash、代码执行、文本编辑器、网络搜索和计算机使用
- 增强的计算机使用:针对自主桌面交互和浏览器自动化工作流进行了优化
- 并行工具执行:为复杂工作流高效协调多个工具
Haiku 4.5 专为需要兼顾智力和效率的用例而设计:
- 实时应用:交互式用户体验的快速响应时间
- 大批量处理:大规模部署的经济高效型智力
- 免费层实现:以可接受的价格提供优质的模型质量
- 子智能体架构:用于多智能体系统的快速、智能的智能体
- 大规模计算机使用:经济高效的自主桌面和浏览器自动化
新 API 功能
编程式工具调用 (Beta)
编程式工具调用允许 Claude 在代码执行容器内通过编写代码以编程方式调用您的工具,而无需每次工具调用都经过模型的往返交互。这显著降低了多工具工作流的延迟,并通过允许 Claude 在数据到达模型上下文窗口之前对其进行过滤或处理来减少 Token 消耗。
tools=[
{
"type": "code_execution_20250825",
"name": "code_execution"
},
{
"name": "query_database",
"description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
"input_schema": {...},
"allowed_callers": ["code_execution_20250825"] # Enable programmatic calling
}
]
主要优势:
- 降低延迟:消除工具调用之间与模型的往返交互
- Token 效率:在返回给 Claude 之前,以编程方式处理和过滤工具结果
- 复杂工作流:支持循环、条件逻辑和批处理
工具搜索工具使 Claude 能够通过按需动态发现和加载工具来处理数百或数千个工具。Claude 不必预先将所有工具定义加载到上下文窗口中,而是搜索您的工具目录并仅加载其所需的工具。
提供两种搜索变体:
- Regex (
tool_search_tool_regex_20251119):Claude 构建正则表达式模式来搜索工具名称、描述和参数 - BM25 (
tool_search_tool_bm25_20251119):Claude 使用自然语言查询来搜索工具
tools=[
{
"type": "tool_search_tool_regex_20251119",
"name": "tool_search_tool_regex"
},
{
"name": "get_weather",
"description": "Get the weather at a specific location",
"input_schema": {...},
"defer_loading": True # Load on-demand via search
}
]
这种方法解决了两个关键挑战:
- 上下文效率:通过不预先加载所有工具定义,节省 10-20K Token
- 工具选择准确性:即使有 100 多个可用工具,也能保持高准确性
Effort 参数 (Beta)
Effort 参数允许您控制 Claude 在响应时使用的 Token 数量,在响应详尽性和 Token 效率之间进行权衡:
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
output_config={
"effort": "medium" # "low", "medium", or "high"
}
)
Effort 参数会影响响应中的所有 Token,包括文本回复、工具调用和扩展思维。较低的 Effort 级别产生更简洁的响应和最少的解释,而较高的 Effort 则提供详细的推理和全面的答案。
工具使用示例 (Beta)
工具使用示例允许您提供有效的工具输入具体示例,以帮助 Claude 了解如何更有效地使用您的工具。这对于具有嵌套对象、可选参数或格式敏感输入的复杂工具特别有用。
tools=[
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {...},
"input_examples": [
{
"location": "San Francisco, CA",
"unit": "fahrenheit"
},
{
"location": "Tokyo, Japan",
"unit": "celsius"
},
{
"location": "New York, NY" # Demonstrates optional 'unit' parameter
}
]
}
]
示例包含在 Prompt 中与工具架构并列,向 Claude 展示格式良好的工具调用的具体模式。每个示例必须根据该工具的 input_schema 有效。
记忆工具 (Beta)
新的记忆工具使 Claude 能够在上下文窗口之外存储和检索信息:
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]
这允许:
- 随时间推移构建知识库
- 跨会话维护项目状态
- 通过基于文件的存储保留实际上无限的上下文
上下文编辑
使用上下文编辑通过自动清除工具调用来进行智能上下文管理:
response = client.beta.messages.create(
betas=["context-management-2025-06-27"],
model="claude-sonnet-4-5", # or claude-haiku-4-5
max_tokens=4096,
messages=[{"role": "user", "content": "..."}],
context_management={
"edits": [
{
"type": "clear_tool_uses_20250919",
"trigger": {"type": "input_tokens", "value": 500},
"keep": {"type": "tool_uses", "value": 2},
"clear_at_least": {"type": "input_tokens", "value": 100}
}
]
},
tools=[...]
)
此功能会在接近 Token 限制时自动删除较旧的工具调用和结果,帮助管理长期运行的智能体会话中的上下文。
增强的停止原因
Claude 4.5 模型引入了一个新的 model_context_window_exceeded 停止原因,明确指示生成何时因达到上下文窗口限制而停止,而不是请求的 max_tokens 限制。这使得在应用程序逻辑中更容易处理上下文窗口限制。
{
"stop_reason": "model_context_window_exceeded",
"usage": {
"input_tokens": 150000,
"output_tokens": 49950
}
}
改进的工具参数处理
Claude 4.5 模型包含一个错误修复,可保留工具调用字符串参数中的预期格式。以前,字符串参数中的尾随换行符有时会被错误地剥离。此修复确保需要精确格式(如文本编辑器)的工具能够准确接收预期的参数。
示例:
// 之前:最后的换行符被意外剥离
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit"
}
}
// 之后:尾随换行符按预期保留
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "edit_todo",
"input": {
"file": "todo.txt",
"contents": "1. Chop onions.\n2. ???\n3. Profit\n"
}
}
Token 计数优化
Claude 4.5 模型包含自动优化以提高模型性能。这些优化可能会向请求添加少量 Token,但您无需为这些系统添加的 Token 付费。
Claude 4 引入的功能
以下功能是在 Claude 4 中引入的,并适用于所有 Claude 4 模型,包括 Claude Sonnet 4.5 和 Claude Haiku 4.5。
新的拒绝(Refusal)停止原因
Claude 4 模型引入了一个新的 refusal 停止原因,用于模型出于安全原因拒绝生成内容的情况:
{
"id": "msg_014XEDjypDjFzgKVWdFUXxZP",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-5",
"content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
"stop_reason": "refusal",
"stop_sequence": null,
"usage": {
"input_tokens": 564,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"output_tokens": 22
}
}
使用 Claude 4 模型时,您应该更新应用程序以处理 refusal 停止原因。
摘要式思维 (Summarized thinking)
启用扩展思维后,Claude 4 模型的 Messages API 会返回 Claude 完整思维过程的摘要。摘要式思维提供了扩展思维的全部智力优势,同时防止滥用。
虽然 API 在 Claude 3.7 和 4 模型之间是一致的,但扩展思维的流式响应可能会以“块状”模式传输,流式事件之间可能存在延迟。
有关更多信息,请参阅扩展思维文档。
穿插思维 (Interleaved thinking)
Claude 4 模型支持将工具使用与扩展思维穿插进行,允许进行更自然的对话,其中工具使用和回复可以与常规消息混合。
有关更多信息,请参阅扩展思维文档。
行为差异
Claude 4 模型有明显的行为变化,可能会影响您构建 Prompt 的方式:
沟通风格的变化
- 更简洁直接:Claude 4 模型的沟通效率更高,解释更少冗长
- 更自然的语气:回复稍微更具对话性,减少了机器味
- 注重效率:完成动作后可能会跳过详细总结以保持工作流势头(如果需要,您可以通过 Prompt 要求更多细节)
指令遵循
Claude 4 模型经过训练可进行精确的指令遵循,需要更明确的指导:
- 明确行动:如果您希望 Claude 采取行动,请使用直接的语言,如“进行这些更改”或“实施此功能”,而不是“您可以建议更改吗”
- 清晰说明期望行为:Claude 将精确遵循指令,因此具体说明您想要什么有助于获得更好的结果
有关使用这些模型的全面指导,请参阅 Claude 4 Prompt 工程最佳实践。
更新的文本编辑器工具
文本编辑器工具已针对 Claude 4 模型进行了更新,更改如下:
- 工具类型:
text_editor_20250728 - 工具名称:
str_replace_based_edit_tool - 不再支持
undo_edit命令
如果您从 Claude Sonnet 3.7 迁移并正在使用文本编辑器工具:
# Claude Sonnet 3.7
tools=[
{
"type": "text_editor_20250124",
"name": "str_replace_editor"
}
]
# Claude 4 Models
tools=[
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
}
]
有关更多信息,请参阅文本编辑器工具文档。
更新的代码执行工具
如果您正在使用代码执行工具,请确保使用最新版本 code_execution_20250825,该版本添加了 Bash 命令和文件操作功能。
旧版本 code_execution_20250522(仅 Python)仍然可用,但不建议用于新实现。
有关迁移说明,请参阅代码执行工具文档。
定价和可用性
定价
Claude 4.5 模型保持了具有竞争力的定价:
| 模型 | 输入 | 输出 |
|---|---|---|
| Claude Opus 4.5 | $5 / 百万 Token | $25 / 百万 Token |
| Claude Sonnet 4.5 | $3 / 百万 Token | $15 / 百万 Token |
| Claude Haiku 4.5 | $1 / 百万 Token | $5 / 百万 Token |
有关更多详细信息,请参阅定价文档。
第三方平台定价
从 Claude 4.5 模型(Opus 4.5、Sonnet 4.5 和 Haiku 4.5)开始,AWS Bedrock 和 Google Vertex AI 提供两种端点类型:
- 全球端点 (Global endpoints):动态路由以实现最大可用性
- 区域端点 (Regional endpoints):保证数据通过特定地理区域路由,价格溢价 10%
此区域定价适用于所有 Claude 4.5 模型:Opus 4.5、Sonnet 4.5 和 Haiku 4.5。
Claude API (1P) 默认为全球模式,不受此更改影响。 Claude API 仅提供全球服务(等同于其他提供商的全球端点产品和定价)。
有关实施细节和迁移指南:
可用性
Claude 4.5 模型可通过以下方式获取:
| 模型 | Claude API | Amazon Bedrock | Google Cloud Vertex AI |
|---|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5-20251101 |
anthropic.claude-opus-4-5-20251101-v1:0 |
claude-opus-4-5@20251101 |
| Claude Sonnet 4.5 | claude-sonnet-4-5-20250929 |
anthropic.claude-sonnet-4-5-20250929-v1:0 |
claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 |
anthropic.claude-haiku-4-5-20251001-v1:0 |
claude-haiku-4-5@20251001 |
也可通过 Claude.ai 和 Claude Code 平台使用。
迁移指南
破坏性更改和迁移要求因您升级前的模型而异。有关详细的迁移说明,包括分步指南、破坏性更改和迁移清单,请参阅迁移到 Claude 4.5。
迁移指南涵盖以下场景:
- Claude Sonnet 3.7 → Sonnet 4.5:包含破坏性更改的完整迁移路径
- Claude Haiku 3.5 → Haiku 4.5:包含破坏性更改的完整迁移路径
- Claude Sonnet 4 → Sonnet 4.5:更改极少的快速升级
- Claude Opus 4.1 → Sonnet 4.5:无破坏性更改的无缝升级
- Claude Opus 4.1 → Opus 4.5:无破坏性更改的无缝升级
- Claude Opus 4.5 → Sonnet 4.5:无破坏性更改的无缝降级