又来一个“最强模型”!Anthropic发布Claude 3.7 Sonnet,兼备“推理模式”与“

 又来一个“最强模型”!Anthropic发布Claude 3.7 Sonnet,兼备“推理模式”与“传统模式”

赵雨荷 


该公司称,Claude 3.7 Sonnet这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与传统模式(实时生成答案)的能力,并表示该模型是市面上唯一的此类“混合”模型。此外,Claude 3.7 Sonnet在编程领域的表现尤为突出,并且能精准控制思考时间。
大力吸引资金的初创企业与科技巨头们争夺AI领域领导权的战争已经白热化。

Anthropic周一发布名为Claude 3.7 Sonnet的模型,该公司表示,这是其有史以来“最智能”的AI模型,称这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与传统模式(实时生成答案)的能力。

Anthropic联合创始人兼首席科学官Jared Kaplan在接受媒体采访时表示,

“这个模型融合了所有功能——我们的目标是拥有一个统一的AI,能适用于各种场景。这样对我们的客户而言会更简单一些。”

“市面上唯一的混合模型”
Anthropic称,Claude 3.7 Sonnet是市面上唯一的此类“混合”模型,并将立即投入使用。Kaplan将其比作人类大脑的运行方式:有的问题需要深度思考,有的问题需要快速作答。但Anthropic希望将这两种能力整合在同一个模型中,而不是完全分开。

分析认为,这一举措或许能为Anthropic在与对手OpenAI以及那些投入巨资开发AI模型的大型科技公司的竞争中赢得急需的优势。Anthropic的聊天机器人Claude与OpenAI的ChatGPT以及谷歌(Google)的Gemini竞争激烈。

另据媒体报道,Anthropic正与Lightspeed和谷歌洽谈一笔高达20亿美元的融资,估值将达到600亿美元。另外,亚马逊对该初创企业的投资约为80亿美元。

曾参与共同创立Instagram的Anthropic产品主管Mike Krieger对媒体表示,这种混合方法能简化聊天机器人的使用流程,让用户无需思考究竟哪种功能最适合。他说,让用户也可以选择模型或者让模型思考多久,对普通用户有些复杂,他希望用户在使用时不必过多操心。

Krieger说,用户可以选择开启或关闭混合选项,来保持简单性,并根据自己的工作需求为模型设定一个“时间预算”。Anthropic还计划于周一推出一款用于编程的代理工具。

Anthropic近期在一些产品发布上赢得了先机。比如,该公司去年率先推出了一种“代理”(agent)功能,很快OpenAI也跟进了类似的举措。Krieger和Kaplan都表示,他们预计竞争对手很快也会转向此种混合模型的方向。

OpenAI首席执行官Sam Altman于2月初曾暗示将朝类似方向发展。他在X平台的帖子中写道,AI公司计划“更好地分享未来路线图,并在简化产品体系方面做得更好。”

“我们也非常厌烦‘模型选择器’,希望回归到那种神奇的统一智能。”

卓越的编程能力、精准控制思考时间
Claude 3.7 Sonnet在编程领域的表现尤为突出。它在编码和前端网页开发方面展现了显著的改进,能够处理复杂的代码库,并在高级工具使用上表现出色。

在多个测试中,Claude 3.7 Sonnet都展现出了卓越的编码能力。例如,Cursor指出Claude在现实编码任务中再次被评为最佳模型,特别是在处理复杂代码库和高级工具使用等方面有显著改进。Cognition发现它在规划代码变更和处理全栈更新方面远胜其他模型。Vercel强调了Claude在复杂代理工作流中的卓越精度,而Replit成功地部署了Claude来从零开始构建复杂的网络应用程序和仪表板,而其他模型则会停滞不前。在Canva的评估中,Claude始终能够生成具有卓越设计品味的生产就绪代码,并显著减少了错误。

Claude 3.7 Sonnet不仅能够产生近乎即时的回应,或进行可让用户看到的、逐步深入的思考,并且 API 用户可以精细控制模型思考的时间长短。

此外,用户还可以通过API控制思考的预算,告诉Claude思考不超过N个标记,N可以是任何值,最高可达其128K标记的输出限制。这种灵活性使得用户可以在速度(和成本)与回答质量之间进行权衡。

网友反应
有网友表示,他让Claude新模型做一个会计分析数据可视化,只花了十秒钟就做完了,感叹到“我们甚至都不需要工作了”。

也有网友嘲笑Claude新模型的知识储备仅限于去年10月之前,他问模型美国总统现在是谁,结果Claude回到说“是卡玛拉·哈里斯”;被网友纠正后,模型才重新回答是特朗普。

于是,有网友觉得Claude新模型不如马斯克推出的Grok 3:

Grok 3已经让Sonnet对我来说变得过时了。Sonnet感觉被极大地限制了,以便成为它自己对“道德正确”的诠释。

还有网友质疑这一新模型的成本过高:

每百万输入tokens收费3美元,每百万输出tokens(包括思考tokens)收费15美元。如果用户在API请求中使用思考功能,这个模型将变得非常昂贵。思考tokens的数量很容易达到数百,甚至有时会达到上千。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

版权声明:
作者:玉兰
链接:https://www.techfm.club/p/193617.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>