语料模型将遇瓶颈?CV机器视觉或成破局点
article.author.display_name
尹洪昌
近期,得益于各大AI模型对于数据需求的提升,以及Reddit等宣布将向聊天机器人公司收取数据使用费等催化,A股数据要素/知识产权/出版传媒板块连续大涨。
但另一方面,国信证券分析师提出,由于人类的自然语义数据是有限的,GPT3训练量是40t语义训练量,GPT4外界有人推测超过了400t的数据量,再往后模型参数越来越大,所需要的数据量也越来越大。人类现有知识马上就用完了,GPT5可能是NLP这个模态最近几年的一个天花板。
其表示,未来各大厂商发力点可能在应用的落地、算力的提升以及“潜在空间非常大”的CV+机器视觉。
资料显示,AI预训练模型有NLP、CV、多模态等。
国信证券指出,其中“CV机器视觉因为模型参数小,开源,全球语义库十倍于NLP文本。目测国内的爆发,第一批会在5-6月份看到用在生产上,到了四季度会有大量公司引入工作流程,极大提升效率,行业不局限于TMT。”
此前文章我们跟大家聊过了CV(计算机视觉),这里跟大家重点聊聊机器视觉。
什么是机器视觉?
机器视觉通俗地讲,就是用机器代替人眼来做测量和判断,其作业过程一般是两个步骤,首先利用光源、镜头、工业相机来负责图片采集,将被检测的目标转换成图像信号。
然后图像处理系统根据像素分布与亮度、颜色等信息,转变成数字信号,然后再对这些信号进行各种运算来抽取目标的特征,进而实现自动识别功能。
相对于人眼,机器视觉在速度、精度、环境要求、连续工作时间等方面均存在显著优势。
机器视觉和计算机视觉的区别?
首先明确,机器视觉和计算机视觉都是人工智能的下属科目,都是利用图像处理、模式识别、人工智能等技术,对图像进行分析和理解。但是,两者的侧重点和应用场景不同。
机器视觉主要应用在工业领域,比如工业检测、自动化控制、智能制造等。而计算机视觉主要应用在偏消费领域,比如人脸识别、行为分析、医学图像、地图导航等。
目前机器视觉主要的应用场景有电子设备及半导体、汽车、制药、食品包装等。其中,电子及半导体设备占约46.60%,主要应用在高精度的制造和检测,如晶圆切割、3C表面检测、AOI光学检测、PCB印刷电路等。汽车制造是机器视觉应用的第二大场景,约占15.3%左右,几乎所有系统和部件的制造都可用到机器视觉。
据招银国际研报,相较于上千亿参数的NLP模型相比,CV模型规模要小两三个数量级,现阶段比较有名的CV大模型包括微软的swin-transformer系列,谷歌的ViT系列以及有150亿参量的V-MOE模型。国内方面,截止2021年,商汤训练了300亿参数的CV模型,2022年华为也发布了30亿参数的盘古系列CV模型。
上文提到,CV机器视觉因为模型参数小,开源,全球语义库十倍于NLP文本。目测国内的爆发,第一批会在5-6月份看到用在生产上。
华安证券也表示,CV模型参数量通常较小,且语料库不存在中英文差异,值得关注。
多重因素叠加,机器视觉百亿蓝海市场
申万宏源表示,短中长期多重因素推动机器视觉市场需求快速提升,预计2025年市场规模突破390亿。
1)从长期来看,未来人口老龄化及劳动力价格上涨将带来机器替人刚需,机器视觉设备将逐步代替人工。
2)从中期来看,机器视觉下游应用广阔,渗透率持续提升,3C领域:终端客户对机器视觉需求从手机扩展至平板、耳机、手表等;锂电领域:除搅拌外,在涂布、辊压、卷绕、入壳等各工序都有机器视觉应用,且视觉技术同样适用于4680等新电池;半导体、光伏等领域:晶圆缺陷检测设备、光伏硅片分选设备等需求提升显著。
3)从短期来看,制造业固定资产开支回暖、国产化加速,将加速机器视觉设备需求释放。依据中国机器视觉产业联盟数据,预计未来市场规模保持25%增长,2025年突破390亿。
相关产业链
产业链方面,机器视觉上游主要是机器视觉底层开发商,即核心零部件(光源、相机、镜头、图像采集卡等)及软件提供商(图像处理软件)且其二者占据了机器视觉80%的比例,是产业链中绝对的核心环节和价值获取者。
中游是二次开发的系统集成和软件服务商,主要根据上游产品以及下游需求进行集成整合,越来越多上游企业向中游业务扩展延伸,形成自有的完整解决方案。
下游则是主要应用领域,涉及到多种制造及服务行业,主要应用于汽车制造、消费电子、食品包装、医疗制药以及服务机器人。
其中,光源是国产化最为充分的环节;镜头的话,高端的部分主要依赖进口;工业相机以欧美进口为主;图像采集卡国内发展较为完善和成熟,图像处理软件则基本被国外企业垄断,国内企业在二次开发中有所布局。
风险提示及免责条款
共有 0 条评论