「中杯」Claude 3.5突然上线,竟比GPT-4o还强!全新Artifacts改写模型交互

【导读】Anthropic曾许下要超越OpenAI的发家愿望,没想到竟然这么快就实现了。他们刚刚发布的Claude 3.5 Sonnet模型不仅成本更低、速度更快,而且在基准测试上的表现「弯道超车」GPT-4o。


继今年3月发布Claude 3之后,Anthropic在半年时间里又上新了!

就在今天,Claude 3.5 Sonnet发布,作为即将推出的Claude 3.5模型家族的「排头兵」,而且已经面向全球开启免费试用。

image

具体来说, Claude 3.5 Sonnet支持200K token的上下文窗口,而在多项评测中超过了OpenAI最强的GPT-4o,以及自家的Claude 3 Opus。

与此同时,Claude 3.5 Sonnet还保持着中等规模的模型所具有的速度和成本优势。

image

其中,在费用方面,Claude 3.5 Sonnet处理每百万输入token仅需3美元,每百万输出token则为15美元。(与前代相同)

image

用户可以在Claude.ai和Claude iOS应用程序上免费体验,如果订阅了Claude Pro和团队计划,则可以享受更高的速率;此外,还可以通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用

生成2倍速,成本仅1/5

Claude 3.5 Sonnet虽然在零样本MATH和MMLU评测中小幅落后GPT-4o,但在研究生级推理(GPQA)、本科级知识(MMLU)和编码能力(HumanEval)上,毋庸置疑地刷新了SOTA——

不仅大幅领先自家的前代老大哥Claude 3 Opus,而且还完成了对谷歌Gemini 1.5 Pro和Meta 4000亿参数的Llama(早期预览版)的全面超越。

它在理解细微差别、幽默和复杂指令方面有显著提升,并且能够用自然、贴近生活的语调撰写高质量内容。

在运行速度方面,Claude 3.5 Sonnet也是Claude 3 Opus的两倍。

这种性能提升,再加上高性价比,使Claude 3.5 Sonnet非常适合处理复杂任务,如上下文敏感的客户支持和多步骤工作流程的协调。

在内部的智能体编码评估中,Claude 3.5 Sonnet解决了64%的问题,优于Claude 3 Opus的38%。

结果显示,在指令和相关工具的支持下,Claude 3.5 Sonnet可以独立编写、编辑和执行代码,具备复杂的推理和故障排除能力。

尤其…

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

「中杯」Claude 3.5突然上线,竟比GPT-4o还强!全新Artifacts改写模型交互

https://www.gptnb.com/2024/06/22/2024-06-21-auto4-VHPEql/

作者

ByteAILab

发布于

2024-06-22

更新于

2025-03-21

许可协议