报道:DeepSeek或加速推出新AI模型R2,最初计划在五月推出
报道:DeepSeek或加速推出新AI模型R2,最初计划在五月推出
article.author.display_name
张雅琦
25日,据路透社报道,DeepSeek计划提前发布其新一代AI模型R2。
报道知情人士透露,R2原定于5月初发布,但现在公司希望尽快推出。DeepSeek表示,新模型将在编程能力和多语言推理方面有所提升。
印度科技服务提供商Zensar的首席运营官Vijayasimha Alilughatta认为,"DeepSeek R2模型的发布可能成为AI行业的转折点",其成本效益高的AI模型开发方式"可能会激发全球企业加速自身努力,打破行业巨头的垄断"。
分析认为,DeepSeek的成功得益于幻方投资十多年来在研究和计算力方面的大量投入。幻方于2020年和2021年斥资12亿元人民币建立了两个AI超级计算集群,其中包括约1万片英伟达A100芯片。
DeepSeek前员工表示,公司的成功主要归功于梁文锋专注于更具成本效益的AI架构。DeepSeek采用了混合专家(MoE)和多头潜在注意力(MLA)等技术,大大降低了计算成本。
报道还称,DeepSeek采用扁平化管理模式,营造协作氛围。创始人梁文锋被前雇主描述为"低调内向",他倾向于与年轻员工一起深入技术细节。
报道援引一位前前员工表示:"梁给了我们掌控权,把我们当专家对待。他不断提问,与我们一起学习。"
风险提示及免责条款
版权声明:
作者:lichengxin
链接:https://www.techfm.club/p/193696.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
THE END
二维码
共有 0 条评论