2024-06-22发表2025-03-21更新 ByteAILab 5 分钟读完 (大约698个字)

「中杯」Claude 3.5突然上线，竟比GPT-4o还强！全新Artifacts改写模型交互

【导读】Anthropic曾许下要超越OpenAI的发家愿望，没想到竟然这么快就实现了。他们刚刚发布的Claude 3.5 Sonnet模型不仅成本更低、速度更快，而且在基准测试上的表现「弯道超车」GPT-4o。

继今年3月发布Claude 3之后，Anthropic在半年时间里又上新了！

就在今天，Claude 3.5 Sonnet发布，作为即将推出的Claude 3.5模型家族的「排头兵」，而且已经面向全球开启免费试用。

具体来说， Claude 3.5 Sonnet支持200K token的上下文窗口，而在多项评测中超过了OpenAI最强的GPT-4o，以及自家的Claude 3 Opus。

与此同时，Claude 3.5 Sonnet还保持着中等规模的模型所具有的速度和成本优势。

其中，在费用方面，Claude 3.5 Sonnet处理每百万输入token仅需3美元，每百万输出token则为15美元。（与前代相同）

用户可以在Claude.ai和Claude iOS应用程序上免费体验，如果订阅了Claude Pro和团队计划，则可以享受更高的速率；此外，还可以通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用

Claude 3.5 Sonnet虽然在零样本MATH和MMLU评测中小幅落后GPT-4o，但在研究生级推理（GPQA）、本科级知识（MMLU）和编码能力（HumanEval）上，毋庸置疑地刷新了SOTA——

不仅大幅领先自家的前代老大哥Claude 3 Opus，而且还完成了对谷歌Gemini 1.5 Pro和Meta 4000亿参数的Llama（早期预览版）的全面超越。

它在理解细微差别、幽默和复杂指令方面有显著提升，并且能够用自然、贴近生活的语调撰写高质量内容。

在运行速度方面，Claude 3.5 Sonnet也是Claude 3 Opus的两倍。

这种性能提升，再加上高性价比，使Claude 3.5 Sonnet非常适合处理复杂任务，如上下文敏感的客户支持和多步骤工作流程的协调。

在内部的智能体编码评估中，Claude 3.5 Sonnet解决了64%的问题，优于Claude 3 Opus的38%。

结果显示，在指令和相关工具的支持下，Claude 3.5 Sonnet可以独立编写、编辑和执行代码，具备复杂的推理和故障排除能力。

尤其…

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

「中杯」Claude 3.5突然上线，竟比GPT-4o还强！全新Artifacts改写模型交互

ByteAILab

2024-06-22

2025-03-21