作者:Grok AI 和人
省流版Claude 4 今日凌晨在 Anthropic 的“Code with Claude 2025”活动中正式发布,包含 Opus 和 Sonnet 两个模型。发布信息显示,Claude 4 在编码和推理方面有显著提升,具体数据包括 Opus 在 SWE-bench 上达到 72.5%,Sonnet 达到 72.7%。定价和可用性:Opus 定价为输入 15 美元/百万令牌,输出 75 美元/百万令牌;Sonnet 定价为输入 3 美元/百万令牌,输出 15 美元/百万令牌,可供免费用户和付费计划使用。发布详情
Claude 4 的发布包括两个主要模型:Claude 4 Opus 和 Claude 4 Sonnet。Opus 被描述为世界上最好的编码模型,擅长长任务处理,内存改进,支持本地文件访问。Sonnet 是 Sonnet 3.7 的升级版,提供更好的编码和推理能力,平衡智能与效率。两者均支持扩展思考工具使用,包括网络搜索和并行工具执行。
关键功能和数据Opus 上下文窗口为 200K 令牌,支持 32K 输出令牌用于编码,提示缓存可节省高达 90% 成本,批量处理节省 50% 成本。Sonnet 适用于免费用户和各种付费计划,定价更低,适合广泛使用。安全措施符合 ASL-3 标准,新增 API 功能包括代码执行工具、MCP 连接器、文件 API 和长达 1 小时的提示缓存。模型详情
Claude 4 包括两个主要模型:Claude 4 Opus 和 Claude 4 Sonnet,分别针对高性能和效率平衡需求。
Claude 4 Opus被描述为“世界上最好的编码模型”,在 SWE-bench 上达到 72.5%,Terminal-bench 上达到 43.2%。擅长长任务处理(长达数小时),内存改进支持本地文件访问。上下文窗口为 200K 令牌,支持 32K 输出令牌用于编码。定价:输入 15 美元/百万令牌,输出 75 美元/百万令牌。可用平台:Anthropic API、Amazon Bedrock、Google Cloud Vertex AI。成本优化:提示缓存可节省高达 90% 成本,批量处理节省 50% 成本。性能基准:行业领先的 SWE-bench,MMLU、GPQA 和 Aider Polyglot 上表现强劲。
Claude 4 Sonnet是 Sonnet 3.7 的严格升级,在 SWE-bench 上达到 72.7%。提供更好的编码和推理能力,支持并行工具使用,内存改进。定价:输入 3 美元/百万令牌,输出 15 美元/百万令牌。可用性:免费用户和 Pro、Max、Team、Enterprise 计划均可使用。平台支持:Anthropic API、Amazon Bedrock、Google Cloud Vertex AI。
关键功能和创新
Claude 4 引入了多项新功能,提升了实用性和安全性:
扩展思考工具使用:包括网络搜索工具和并行工具执行,处于 beta 阶段。Claude Code 全面可用:与 VS Code、JetBrains、GitHub Actions 集成,支持 IDE 内联编辑,/install-github-app 为 GitHub beta 提供支持 (more info[1])。新 API 功能:包括代码执行工具、MCP 连接器、文件 API 和长达 1 小时的提示缓存 (API details[2])。安全措施:符合 ASL-3 安全标准,确保模型在高风险场景下的可靠性 (safety info[3])。开发者模式:提供原始思维链,适合高级用户,配合更小的模型生成思维摘要(5% 情况下使用)。性能数据和基准测试
以下表格总结了 Claude 4 的关键性能指标:
模型SWE-bench 得分Terminal-bench 得分上下文窗口输出令牌支持 (编码)定价 (输入/输出, 美元/百万令牌)Claude 4 Opus72.5%43.2%200K32K15 / 75Claude 4 Sonnet72.7%35.5--3 / 15
此外,Opus 在 MMLU、GPQA 和 Aider Polyglot 等通用基准测试中表现强劲,具体分数未在公开信息中详细列出,但被描述为“行业领先”。
定价和可用性
Claude 4 的定价策略旨在覆盖不同用户群体。Opus 的高定价(15/75 美元/百万令牌)针对企业级用户,而 Sonnet 的低定价(3/15 美元/百万令牌)确保免费用户和小型团队也能访问。成本优化功能如提示缓存和批量处理进一步降低了使用成本,特别是在高频场景下。
安全和伦理考虑
Anthropic 强调了 ASL-3 安全标准,确保 Claude 4 在高风险应用中的可靠性。这包括对模型输出的监控和潜在风险的缓解措施,体现了公司在 AI 伦理方面的承诺。
关键引文Introducing Claude 4 news: https://www.anthropic.com/news/claude-4Claude Opus 4 details: https://www.anthropic.com/claude/opusClaude Code integrations: https://www.anthropic.com/claude-codeAPI capabilities details: https://www.anthropic.com/news/agent-capabilities-apiASL-3 safety measures: https://www.anthropic.com/news/activating-asl3-protections参考资料[1]
more info: https://www.anthropic.com/claude-code
[2]
API details: https://www.anthropic.com/news/agent-capabilities-api
[3]
safety info: https://www.anthropic.com/news/activating-asl3-protections