“开源大模型新王者”:不是Meta的Llama 2,来自这家欧洲公司

 “开源大模型新王者”:不是Meta的Llama 2,来自这家欧洲公司

article.author.display_name
李笑寅


更小的尺寸、更优的性能,成立6个月的Mistral AI对垒硅谷。
你见过比Llama 2参数小10倍、性能更好还支持开源的大语言模型吗?

Mistral 7B做到了。

根据媒体报道,Mistral发布的“预告模型”显示,在参数量为Llama 2 70B的十分之一的基础上,Mistral 7B成功在MT Bench上击败了Llama 2。

MT Bench作为一个测试降准,由80个高质量的多轮对话问题组成,旨在测试多轮对话和指令遵循能力。

这意味着大语言模型(LLM)终于在参数尺寸和性能平衡的问题上找到了一个解决方案。据官方介绍,Mistral 7B在所有标准英语和代码基准测试中的性能优于当前可用的高达13B参数的LLM。

今年9月,刚刚成立6个月的法国AI公司Mistral AI正式发布Mistral 7B;上周,作为唯一一家欧洲公司,Mistral AI参加了10月在英国举办的人工智能工程师峰会,与OpenAI、谷歌、Meta等科技巨头同台。

“技术先驱”
专业度让Mistral成为AI投资界的新宠儿。

Mistral的创始人Arthur Mensch在接受媒体采访时表示,尽管作为一家年轻的初创公司,但Mistral对标的是包括谷歌、OpenAI在内的整个AI行业:

“我们一直是这项技术的先驱。”

“我们与所有人竞争。”

Mistral官方这样形容Mistral 7B的成长速度:

“两年内,它从Gopher到Chinchilla,再到Llama 2,以及Mistral 7B。"

其中:Gopher由DeepMind于2021年推出,280B参数量;Chinchilla由DeepMind由于2022年推出,70B参数量;Llama 2由Meta于2023年7月推出,34B参数量。

目前,有消息称a16z考虑向Mistral投资2.5亿美元。据直接了解谈判情况的人士透露,包括General Catalyst和Andreessen Horowitz在内的硅谷重量级企业正在考虑出资4亿欧元,这可能会推升Mistral的估值达到15-20亿欧元。

Lightspeed Venture Partners 的合伙人安托万·莫伊鲁德 (Antoine Moyroud) 主导了Mistral的第一轮融资,他表示:“他们的表现超出了我们的内部预期,”并补充道“对这项业务越来越感到兴奋。”

和硅谷分庭抗礼?
目前,以谷歌、OpenAI为首的硅谷AI公司正处于金字塔顶端,并不断向上谋求发展,这些硅谷公司也是大多数投资者重点关注的对象。

据悉,OpenAI 正在尝试以860亿美元的估值出售员工股票;Anthropic最近收到了谷歌和亚马逊的投资承诺,投资总额可能达到60亿美元。

Mistral的异军突起点亮了欧洲在AI领域的一盏灯。

因为市值超过10亿欧元的公司在欧洲更为稀缺,而此前法国总统马克龙也多次暗示对AI领域的雄心勃勃,希望能够培育欧洲本土的AI企业。

Mistral的优势不止于技术面,Mensch曾表示,相对于规模更大、资金更充足的竞争对手,Mistral在效率上更有优势。

他表示,该公司仅用10人的团队就推出了第一个LLM模型,培训成本不到50万美元,而竞争对手则花费了数千万美元。他补充道:“我们很高兴成为资本效率最高的LLM公司。”

另一个优势在于开源。因Mistral公开发布其AI模型,支持Apache 2.0开源协议,这能够使企业客户更好地控制他们的数据,对其中的使用过程可见性更高,并且能够吸引开发领域的专业人才。

不过,尽管Mistral在6月的种子轮融资中获得了创纪录的1.05亿欧元,但其目前尚未盈利。Mensch表示这种情况将在“年底前”发生改变,他预计将发布一个新平台供客户访问其LLM模型。

Mitral投资方之一的New Wave的合伙人皮亚·德伊里巴内 (Pia d'Iribarne) 表示,建立大型人工智能企业的“基本面已经具备”。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

版权声明:
作者:玉兰
链接:https://www.techfm.club/p/84169.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>