「中杯」Claude 3.5突然上线,竟比GPT-4o还强!全新Artifacts改写模型交互
【导读】Anthropic曾许下要超越OpenAI的发家愿望,没想到竟然这么快就实现了。他们刚刚发布的Claude 3.5 Sonnet模型不仅成本更低、速度更快,而且在基准测试上的表现「弯道超车」GPT-4o。
继今年3月发布Claude 3之后,Anthropic在半年时间里又上新了!
就在今天,Claude 3.5 Sonnet发布,作为即将推出的Claude 3.5模型家族的「排头兵」,而且已经面向全球开启免费试用。
具体来说, Claude 3.5 Sonnet支持200K token的上下文窗口,而在多项评测中超过了OpenAI最强的GPT-4o,以及自家的Claude 3 Opus。
与此同时,Claude 3.5 Sonnet还保持着中等规模的模型所具有的速度和成本优势。
其中,在费用方面,Claude 3.5 Sonnet处理每百万输入token仅需3美元,每百万输出token则为15美元。(与前代相同)
用户可以在Claude.ai和Claude iOS应用程序上免费体验,如果订阅了Claude Pro和团队计划,则可以享受更高的速率;此外,还可以通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用
生成2倍速,成本仅1/5
Claude 3.5 Sonnet虽然在零样本MATH和MMLU评测中小幅落后GPT-4o,但在研究生级推理(GPQA)、本科级知识(MMLU)和编码能力(HumanEval)上,毋庸置疑地刷新了SOTA——
不仅大幅领先自家的前代老大哥Claude 3 Opus,而且还完成了对谷歌Gemini 1.5 Pro和Meta 4000亿参数的Llama(早期预览版)的全面超越。
它在理解细微差别、幽默和复杂指令方面有显著提升,并且能够用自然、贴近生活的语调撰写高质量内容。
在运行速度方面,Claude 3.5 Sonnet也是Claude 3 Opus的两倍。
这种性能提升,再加上高性价比,使Claude 3.5 Sonnet非常适合处理复杂任务,如上下文敏感的客户支持和多步骤工作流程的协调。
在内部的智能体编码评估中,Claude 3.5 Sonnet解决了64%的问题,优于Claude 3 Opus的38%。
结果显示,在指令和相关工具的支持下,Claude 3.5 Sonnet可以独立编写、编辑和执行代码,具备复杂的推理和故障排除能力。
尤其…
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
「中杯」Claude 3.5突然上线,竟比GPT-4o还强!全新Artifacts改写模型交互