day29/100 人工智能产品体系
以下来自《人工智能产品经理:AI时代PM修炼手册》读书笔记
什么样的定位还是要先看什么样的书,作为想转行AIPM的文科小白,前几天先看了《生成式人工智能》和《AICG从入门到实践》这两本书,虽然对AIGC有从底层逻辑到商业落地的一个系统认知,但涉及到技术部分,比如说人工智能近几年发展迅速的原因之一得力于芯片的发展,那为什么芯片的发展对人工智能这么重要?为什么算力、算法、数据在人工智能体系里扮演基础角色?各个模型的作用是这些,但是为什么又存在各个模型等等,书里是对这些信息直接拿来用,对于真的纯小白的我,会感觉知识不成体系,理解也有点困难。
《人工智能产品经理:AI时代PM修炼手册》这本书看了第一章之后就直接奔着产品体系部分去了。本书中将复杂的人工智能产品体系以众多人工智能产品形态中抽象出来,对整个架构自上而下刨析,从产品角度描述以及告知作为产品而言需要所理解的技术界限,更能帮助我这个小白入门学习人工智能产品设计。
这本书出版时间有点早23年1月,对人工智能产品体系的描述角度是基于《人工智能标准化白皮书(2018版)》展开的,但是我觉得不影响入门学习。
首先说明整个体系中,包括基础设施提供者、数据提供者、数据处理者、系统协调者这四类重要角色,然后基于数据流转和处理的角度对整个人工智能产品体系分析,再基于这一逻辑架构对各个组成部分展开。
一、四类角色概述
1、基础设施提供者,为为整个产品体系提供计算能力,产品与外界沟通的工具,并通过基础平台实现支撑,主要包传感器、芯片、基础平台。
1)传感器制造商提供针对互联网和物联网的数据采集工作的各种软/硬件产品,包括传感器、摄像头、麦克风、触摸屏、网络数据采集器等。
2)芯片和系统开发商提供运算能力,例如GPU、CPU、FPGA、ASIC等。
3)基础平台包括分布式计算框架提供商及网络提供商提供的平台保障和支持,包括云存储、云计算以及通讯网络等。
2、数据提供者,利用各种数据采集手段采集原始数据,是体系的数据来源,
3、数据处理者,各种人工智能技术和服务提供商,负责数据加工、智能信息表示与形成、智能推理、智能决策及智能执行与输出等工作。
1)数据加工:数据清洗、转换、归一化、拆分、采样等)。
2)模型训练:目标是从数据中获取“经验”,形成模型,并对新问题进行识别与预测。
4、系统协调者,负责系统的集成、需求的定义、资源的协调、解决方案的封装,以及除研发以外一切可以保障人工智能产品顺利运行和在行业落地所需的工作。
其中从数据提供者到数据处理者的流程传递,完成了“数据—信息—知识—智慧”的过程。
二、基础设施
1、传感器
定义:传感器是一种物理装置或生物器官,能够探测、感受外界的信号、物理条件(如光、热、湿度)或化学组成(如烟雾),并将探知的信息传递给其他装置或器官。传感器的作用是将一种信号模式转换为另外一种信号模式。
分类:按照应用领域不同,可以将传感器分为如下类型:压力传感器、湿度传感器、温度传感器、PH传感器、流量传感器、液位传感器、超声波传感器、浸水传感器、照度传感器、差压变送器、加速度传感器、位移传感器、称重传感器、测距传感器等。
作用:数据作为人工智能的养料,其质量决定了最终人工智能模型和落地效果的成败。
2.芯片
定义:芯片内部由无数微小的晶体管组成,这些晶体管就像一个个微小的开关,可以控制电流的通断。通过复杂的电路连接,这些晶体管可以组合成各种逻辑门(如与门、或门、非门等),从而实现基本的逻辑运算。
逻辑门是电子电路的基本单元,它们通过控制电流的流动来表达0/1。逻辑门就像简单的“规则”,通过组合它们,可以实现更复杂的逻辑运算。
分类:按照定制化程度,分为通用型芯片、半定制化芯片(FPGA芯片)、全定制化芯片(ASIC芯片)三种。
1)可以处理所以类型任务的芯片被成为通用型芯片,如CPU、GPU、TPU。特点造价贵、运算效率低。
2)FPGA(Field Programmable Gate Array,可编程门阵列),可以进行修改迭代,以实现特定的功能。当处理小计算量、大批次的计算时,性能高于GPU。
3)ASIC(Application Specific Integrated Circuits,应用专用集成电路),一种为专门目的设计的芯片,开模后不能再变。设计周期长,但是可以将算法模型烧到芯片里,运算效率高。
3.基础平台
从传感器和各种数据采集渠道中获取的大量数据需要被合理地存放到数据库中,为人工智能模型训练提供“养料”。在整个数据的存放、传输、计算的过程中,存储资源、网络资源以及计算资源作为基础平台的重要组成部分,成了挖掘数据中价值的重要保证。
3.1大数据技术
包括数据存储、数据处理、数据分析三大重点领域,主要目标时从海量数据中挖掘价值。与人工智能的交叉点在于对不同的海量数据进行存储、处理。
3.2云计算技术
定义:云计算是一种按使用量付费的模式,提供可用的、按需的网络访问,仅需可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能被快速提供,但只投入少量的管理工作。
作用:人工智能可以利用云计算技术实现基础资源层的弹性伸缩并以很低的价格供用户使用。例如深度学习需要大量的数据集训练一个复杂的神经网络结构,这个过程依赖于大量的计算资源,如果每个企业都需要自己购买硬件服务器作为计算资源,那么不仅对于企业来说风险很高,对于整个社会来说也将产生大量的资源浪费。
三、数据采集
不同人工智能产品的数据从采集过程不同,由于数据类型多、数据量大,需要采用各种工具和技术辅助才能实现采集过程。
3.1常见的数据获取方式
1)直接购买行业数据或免费获得:从开放的数据集网站获取,或从运营商、行业数据分析公司直接购买。
2)自行采集,通过字数行业积累直接获取用户数据,或通过爬虫技术采集。
3)第三方合作,与友商或上下游合作伙伴交换或购买数据。
3.2数据质量
可以从关联度、可信性、时效性、完整度四个方面衡量。
四、数据处理
数据处理是人工智能体系中通过对原材料(例如图像、文字、神经元信号等)进行加工,并赋予机器类似于人的技能的关键过程。
五、资源配置统筹:系统协调
系统协调者需要在人工智能的不同阶段:需求定义、设计开发、系统优化、运行保障、售后支持、监控和审计发挥资源协调和统筹作用。
共有 0 条评论