报道：DeepSeek或加速推出新AI模型R2，最初计划在五月推出

lichengxin • 2025-02-25 11:45 • 杂文

article.author.display_name

张雅琦

DeepSeek原计划于5月初发布R2模型，但据路透社援引知情人士透露，公司正寻求尽快推出。R2预计将在编程和多语言推理方面实现更优性能。

25日，据路透社报道，DeepSeek计划提前发布其新一代AI模型R2。

报道知情人士透露，R2原定于5月初发布，但现在公司希望尽快推出。DeepSeek表示，新模型将在编程能力和多语言推理方面有所提升。

印度科技服务提供商Zensar的首席运营官Vijayasimha Alilughatta认为，"DeepSeek R2模型的发布可能成为AI行业的转折点"，其成本效益高的AI模型开发方式"可能会激发全球企业加速自身努力，打破行业巨头的垄断"。

分析认为，DeepSeek的成功得益于幻方投资十多年来在研究和计算力方面的大量投入。幻方于2020年和2021年斥资12亿元人民币建立了两个AI超级计算集群，其中包括约1万片英伟达A100芯片。

DeepSeek前员工表示，公司的成功主要归功于梁文锋专注于更具成本效益的AI架构。DeepSeek采用了混合专家（MoE）和多头潜在注意力（MLA）等技术，大大降低了计算成本。

报道还称，DeepSeek采用扁平化管理模式，营造协作氛围。创始人梁文锋被前雇主描述为"低调内向"，他倾向于与年轻员工一起深入技术细节。

报道援引一位前前员工表示："梁给了我们掌控权，把我们当专家对待。他不断提问，与我们一起学习。"

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

版权声明：
作者：lichengxin
链接：https://www.techfm.club/p/193696.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

俄罗斯开出停战条件

下一篇>>

搜索内容