又来一个“最强模型”！Anthropic发布Claude 3.7 Sonnet，兼备“推理模式”与“

玉兰 • 16小时前 • 杂文

　又来一个“最强模型”！Anthropic发布Claude 3.7 Sonnet，兼备“推理模式”与“传统模式”

赵雨荷

该公司称，Claude 3.7 Sonnet这种“混合型”模型同时具备“推理模式”（停下来思考复杂答案）与传统模式（实时生成答案）的能力，并表示该模型是市面上唯一的此类“混合”模型。此外，Claude 3.7 Sonnet在编程领域的表现尤为突出，并且能精准控制思考时间。

大力吸引资金的初创企业与科技巨头们争夺AI领域领导权的战争已经白热化。

Anthropic周一发布名为Claude 3.7 Sonnet的模型，该公司表示，这是其有史以来“最智能”的AI模型，称这种“混合型”模型同时具备“推理模式”（停下来思考复杂答案）与传统模式（实时生成答案）的能力。

Anthropic联合创始人兼首席科学官Jared Kaplan在接受媒体采访时表示，

“这个模型融合了所有功能——我们的目标是拥有一个统一的AI，能适用于各种场景。这样对我们的客户而言会更简单一些。”

“市面上唯一的混合模型”

Anthropic称，Claude 3.7 Sonnet是市面上唯一的此类“混合”模型，并将立即投入使用。Kaplan将其比作人类大脑的运行方式：有的问题需要深度思考，有的问题需要快速作答。但Anthropic希望将这两种能力整合在同一个模型中，而不是完全分开。

分析认为，这一举措或许能为Anthropic在与对手OpenAI以及那些投入巨资开发AI模型的大型科技公司的竞争中赢得急需的优势。Anthropic的聊天机器人Claude与OpenAI的ChatGPT以及谷歌（Google）的Gemini竞争激烈。

另据媒体报道，Anthropic正与Lightspeed和谷歌洽谈一笔高达20亿美元的融资，估值将达到600亿美元。另外，亚马逊对该初创企业的投资约为80亿美元。

曾参与共同创立Instagram的Anthropic产品主管Mike Krieger对媒体表示，这种混合方法能简化聊天机器人的使用流程，让用户无需思考究竟哪种功能最适合。他说，让用户也可以选择模型或者让模型思考多久，对普通用户有些复杂，他希望用户在使用时不必过多操心。

Krieger说，用户可以选择开启或关闭混合选项，来保持简单性，并根据自己的工作需求为模型设定一个“时间预算”。Anthropic还计划于周一推出一款用于编程的代理工具。

Anthropic近期在一些产品发布上赢得了先机。比如，该公司去年率先推出了一种“代理”（agent）功能，很快OpenAI也跟进了类似的举措。Krieger和Kaplan都表示，他们预计竞争对手很快也会转向此种混合模型的方向。

OpenAI首席执行官Sam Altman于2月初曾暗示将朝类似方向发展。他在X平台的帖子中写道，AI公司计划“更好地分享未来路线图，并在简化产品体系方面做得更好。”

“我们也非常厌烦‘模型选择器’，希望回归到那种神奇的统一智能。”

卓越的编程能力、精准控制思考时间

Claude 3.7 Sonnet在编程领域的表现尤为突出。它在编码和前端网页开发方面展现了显著的改进，能够处理复杂的代码库，并在高级工具使用上表现出色。

在多个测试中，Claude 3.7 Sonnet都展现出了卓越的编码能力。例如，Cursor指出Claude在现实编码任务中再次被评为最佳模型，特别是在处理复杂代码库和高级工具使用等方面有显著改进。Cognition发现它在规划代码变更和处理全栈更新方面远胜其他模型。Vercel强调了Claude在复杂代理工作流中的卓越精度，而Replit成功地部署了Claude来从零开始构建复杂的网络应用程序和仪表板，而其他模型则会停滞不前。在Canva的评估中，Claude始终能够生成具有卓越设计品味的生产就绪代码，并显著减少了错误。

Claude 3.7 Sonnet不仅能够产生近乎即时的回应，或进行可让用户看到的、逐步深入的思考，并且 API 用户可以精细控制模型思考的时间长短。

此外，用户还可以通过API控制思考的预算，告诉Claude思考不超过N个标记，N可以是任何值，最高可达其128K标记的输出限制。这种灵活性使得用户可以在速度（和成本）与回答质量之间进行权衡。

网友反应

有网友表示，他让Claude新模型做一个会计分析数据可视化，只花了十秒钟就做完了，感叹到“我们甚至都不需要工作了”。

也有网友嘲笑Claude新模型的知识储备仅限于去年10月之前，他问模型美国总统现在是谁，结果Claude回到说“是卡玛拉·哈里斯”；被网友纠正后，模型才重新回答是特朗普。

于是，有网友觉得Claude新模型不如马斯克推出的Grok 3：

Grok 3已经让Sonnet对我来说变得过时了。Sonnet感觉被极大地限制了，以便成为它自己对“道德正确”的诠释。

还有网友质疑这一新模型的成本过高：

每百万输入tokens收费3美元，每百万输出tokens（包括思考tokens）收费15美元。如果用户在API请求中使用思考功能，这个模型将变得非常昂贵。思考tokens的数量很容易达到数百，甚至有时会达到上千。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

版权声明：
作者：玉兰
链接：https://www.techfm.club/p/193617.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

点绛唇·家书

< <上一篇

中美俄均投下赞成票联合国安理会通过涉乌决议

下一篇>>

搜索内容

又来一个“最强模型”！Anthropic发布Claude 3.7 Sonnet，兼备“推理模式”与“

取消回复

共有 0 条评论

Ads