Linguista

Claude 4.5 新特性「Anthropic官方」

Claude 4.5 推出了三款针对不同用例设计的模型:

Opus 4.5 相比 Opus 4.1 的主要改进

极致智力

Claude Opus 4.5 代表了我们最智能的模型,结合了极致的能力与实用的性能。它在推理、编程和复杂问题解决任务上实现了阶梯式的提升,同时保持了 Opus 系列一贯的高质量输出。

Effort 参数

Claude Opus 4.5 是唯一支持 Effort 参数的模型,允许您控制 Claude 在响应时使用的 Token 数量。这使您能够通过单个模型在回复的详尽程度和 Token 效率之间进行权衡。

Effort 参数会影响响应中的所有 Token,包括文本回复、工具调用和扩展思维。您可以选择:

卓越的计算机使用能力

Claude Opus 4.5 引入了增强的计算机使用能力,新增了缩放(zoom)操作,能够以全分辨率详细检查特定的屏幕区域。这使得 Claude 能够检查在标准截图中可能不清楚的细微 UI 元素、小字体文本和详细的视觉信息。

缩放功能在以下方面特别有价值:

实用性能

Claude Opus 4.5 以比之前的 Opus 模型更亲民的价格提供旗舰级的智力,使先进的 AI 能力能够应用于更广泛的应用程序和用例。

思维块保留

Claude Opus 4.5 自动保留所有之前的思维块贯穿整个对话,在扩展的多轮交互和工具使用会话中保持推理的连续性。这确保了 Claude 在处理复杂的、长期运行的任务时,可以有效利用其完整的推理历史。

Sonnet 4.5 相比 Sonnet 4 的主要改进

卓越的编程能力

Claude Sonnet 4.5 是我们需要迄今为止最好的编程模型,在整个开发生命周期中都有显著改进:

当启用扩展思维时,Claude Sonnet 4.5 在编程任务上的表现显著更好。扩展思维默认是禁用的,但我们建议在进行复杂的编程工作时启用它。请注意,扩展思维会影响 Prompt 缓存效率。有关配置详情,请参阅迁移指南

智能体能力

Claude Sonnet 4.5 在智能体能力方面引入了重大进展:

Claude Sonnet 4.5 拥有一种改进的沟通方式,即简洁、直接且自然。它提供基于事实的进度更新,并且可能会在工具调用后跳过冗长的总结以保持工作流的势头(尽管可以通过 Prompt 调整这一点)。

有关使用此沟通风格的详细指导,请参阅 Claude 4 最佳实践

创意内容生成

Claude Sonnet 4.5 在创意内容任务方面表现出色:

Haiku 4.5 相比 Haiku 3.5 的主要改进

Claude Haiku 4.5 代表了 Haiku 模型系列的变革性飞跃,为我们最快的模型类别带来了前沿能力:

极速且接近前沿的智力

Claude Haiku 4.5 以更低的成本和更快的速度提供了与 Sonnet 4 相当的接近前沿的性能:

扩展思维能力

Claude Haiku 4.5 是首个支持扩展思维的 Haiku 模型,为 Haiku 系列带来了高级推理能力:

必须通过在 API 请求中添加 thinking 参数来显式启用扩展思维。有关实现细节,请参阅扩展思维文档

当启用扩展思维时,Claude Haiku 4.5 在编程和推理任务上的表现显著更好。扩展思维默认是禁用的,但我们建议在处理复杂问题解决、编程工作和多步推理时启用它。请注意,扩展思维会影响 Prompt 缓存效率。有关配置详情,请参阅迁移指南

上下文感知

Claude Haiku 4.5 具有上下文感知功能,使模型能够在整个对话过程中追踪其剩余的上下文窗口:

这是首个具有原生上下文感知能力的 Haiku 模型。有关 Prompt 指南,请参阅 Claude 4 最佳实践

强大的编程和工具使用

Claude Haiku 4.5 提供了现代 Claude 模型所期望的强大编程能力:

Haiku 4.5 专为需要兼顾智力和效率的用例而设计:

新 API 功能

编程式工具调用 (Beta)

编程式工具调用允许 Claude 在代码执行容器内通过编写代码以编程方式调用您的工具,而无需每次工具调用都经过模型的往返交互。这显著降低了多工具工作流的延迟,并通过允许 Claude 在数据到达模型上下文窗口之前对其进行过滤或处理来减少 Token 消耗。

tools=[
    {
        "type": "code_execution_20250825",
        "name": "code_execution"
    },
    {
        "name": "query_database",
        "description": "Execute a SQL query against the sales database. Returns a list of rows as JSON objects.",
        "input_schema": {...},
        "allowed_callers": ["code_execution_20250825"]  # Enable programmatic calling
    }
]

主要优势:

工具搜索工具使 Claude 能够通过按需动态发现和加载工具来处理数百或数千个工具。Claude 不必预先将所有工具定义加载到上下文窗口中,而是搜索您的工具目录并仅加载其所需的工具。

提供两种搜索变体:

tools=[
    {
        "type": "tool_search_tool_regex_20251119",
        "name": "tool_search_tool_regex"
    },
    {
        "name": "get_weather",
        "description": "Get the weather at a specific location",
        "input_schema": {...},
        "defer_loading": True  # Load on-demand via search
    }
]

这种方法解决了两个关键挑战:

Effort 参数 (Beta)

Effort 参数允许您控制 Claude 在响应时使用的 Token 数量,在响应详尽性和 Token 效率之间进行权衡:

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=["effort-2025-11-24"],
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    output_config={
        "effort": "medium"  # "low", "medium", or "high"
    }
)

Effort 参数会影响响应中的所有 Token,包括文本回复、工具调用和扩展思维。较低的 Effort 级别产生更简洁的响应和最少的解释,而较高的 Effort 则提供详细的推理和全面的答案。

工具使用示例 (Beta)

工具使用示例允许您提供有效的工具输入具体示例,以帮助 Claude 了解如何更有效地使用您的工具。这对于具有嵌套对象、可选参数或格式敏感输入的复杂工具特别有用。

tools=[
    {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {...},
        "input_examples": [
            {
                "location": "San Francisco, CA",
                "unit": "fahrenheit"
            },
            {
                "location": "Tokyo, Japan",
                "unit": "celsius"
            },
            {
                "location": "New York, NY"  # Demonstrates optional 'unit' parameter
            }
        ]
    }
]

示例包含在 Prompt 中与工具架构并列,向 Claude 展示格式良好的工具调用的具体模式。每个示例必须根据该工具的 input_schema 有效。

记忆工具 (Beta)

新的记忆工具使 Claude 能够在上下文窗口之外存储和检索信息:

tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]

这允许:

上下文编辑

使用上下文编辑通过自动清除工具调用来进行智能上下文管理:

response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",  # or claude-haiku-4-5
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)

此功能会在接近 Token 限制时自动删除较旧的工具调用和结果,帮助管理长期运行的智能体会话中的上下文。

增强的停止原因

Claude 4.5 模型引入了一个新的 model_context_window_exceeded 停止原因,明确指示生成何时因达到上下文窗口限制而停止,而不是请求的 max_tokens 限制。这使得在应用程序逻辑中更容易处理上下文窗口限制。

{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

改进的工具参数处理

Claude 4.5 模型包含一个错误修复,可保留工具调用字符串参数中的预期格式。以前,字符串参数中的尾随换行符有时会被错误地剥离。此修复确保需要精确格式(如文本编辑器)的工具能够准确接收预期的参数。

示例:

// 之前:最后的换行符被意外剥离
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// 之后:尾随换行符按预期保留
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

Token 计数优化

Claude 4.5 模型包含自动优化以提高模型性能。这些优化可能会向请求添加少量 Token,但您无需为这些系统添加的 Token 付费

Claude 4 引入的功能

以下功能是在 Claude 4 中引入的,并适用于所有 Claude 4 模型,包括 Claude Sonnet 4.5 和 Claude Haiku 4.5。

新的拒绝(Refusal)停止原因

Claude 4 模型引入了一个新的 refusal 停止原因,用于模型出于安全原因拒绝生成内容的情况:

{
  "id": "msg_014XEDjypDjFzgKVWdFUXxZP",
  "type": "message",
  "role": "assistant",
  "model": "claude-sonnet-4-5",
  "content": [{"type": "text", "text": "I would be happy to assist you. You can "}],
  "stop_reason": "refusal",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 564,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 22
  }
}

使用 Claude 4 模型时,您应该更新应用程序以处理 refusal 停止原因

摘要式思维 (Summarized thinking)

启用扩展思维后,Claude 4 模型的 Messages API 会返回 Claude 完整思维过程的摘要。摘要式思维提供了扩展思维的全部智力优势,同时防止滥用。

虽然 API 在 Claude 3.7 和 4 模型之间是一致的,但扩展思维的流式响应可能会以“块状”模式传输,流式事件之间可能存在延迟。

有关更多信息,请参阅扩展思维文档

穿插思维 (Interleaved thinking)

Claude 4 模型支持将工具使用与扩展思维穿插进行,允许进行更自然的对话,其中工具使用和回复可以与常规消息混合。

有关更多信息,请参阅扩展思维文档

行为差异

Claude 4 模型有明显的行为变化,可能会影响您构建 Prompt 的方式:

沟通风格的变化

指令遵循

Claude 4 模型经过训练可进行精确的指令遵循,需要更明确的指导:

有关使用这些模型的全面指导,请参阅 Claude 4 Prompt 工程最佳实践

更新的文本编辑器工具

文本编辑器工具已针对 Claude 4 模型进行了更新,更改如下:

如果您从 Claude Sonnet 3.7 迁移并正在使用文本编辑器工具:

# Claude Sonnet 3.7
tools=[
    {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
    }
]

# Claude 4 Models
tools=[
    {
        "type": "text_editor_20250728",
        "name": "str_replace_based_edit_tool"
    }
]

有关更多信息,请参阅文本编辑器工具文档

更新的代码执行工具

如果您正在使用代码执行工具,请确保使用最新版本 code_execution_20250825,该版本添加了 Bash 命令和文件操作功能。

旧版本 code_execution_20250522(仅 Python)仍然可用,但不建议用于新实现。

有关迁移说明,请参阅代码执行工具文档

定价和可用性

定价

Claude 4.5 模型保持了具有竞争力的定价:

模型 输入 输出
Claude Opus 4.5 $5 / 百万 Token $25 / 百万 Token
Claude Sonnet 4.5 $3 / 百万 Token $15 / 百万 Token
Claude Haiku 4.5 $1 / 百万 Token $5 / 百万 Token

有关更多详细信息,请参阅定价文档

第三方平台定价

从 Claude 4.5 模型(Opus 4.5、Sonnet 4.5 和 Haiku 4.5)开始,AWS Bedrock 和 Google Vertex AI 提供两种端点类型:

此区域定价适用于所有 Claude 4.5 模型:Opus 4.5、Sonnet 4.5 和 Haiku 4.5。

Claude API (1P) 默认为全球模式,不受此更改影响。 Claude API 仅提供全球服务(等同于其他提供商的全球端点产品和定价)。

有关实施细节和迁移指南:

可用性

Claude 4.5 模型可通过以下方式获取:

模型 Claude API Amazon Bedrock Google Cloud Vertex AI
Claude Opus 4.5 claude-opus-4-5-20251101 anthropic.claude-opus-4-5-20251101-v1:0 claude-opus-4-5@20251101
Claude Sonnet 4.5 claude-sonnet-4-5-20250929 anthropic.claude-sonnet-4-5-20250929-v1:0 claude-sonnet-4-5@20250929
Claude Haiku 4.5 claude-haiku-4-5-20251001 anthropic.claude-haiku-4-5-20251001-v1:0 claude-haiku-4-5@20251001

也可通过 Claude.ai 和 Claude Code 平台使用。

迁移指南

破坏性更改和迁移要求因您升级前的模型而异。有关详细的迁移说明,包括分步指南、破坏性更改和迁移清单,请参阅迁移到 Claude 4.5

迁移指南涵盖以下场景:

最佳实践

学习 Claude 4.5 模型的 Prompt 工程技巧

模型概览

将 Claude 4.5 模型与其他 Claude 模型进行比较

迁移指南

从以前的模型升级