人工智能行业的“拆文解字”|高达.原创

时间:2018-03-02

2018年的春晚,王菲和那英再度聚首合唱了一首《岁月》,让观众又想起20年前,王菲和那英合唱那首广为传唱的《相约1998》。同样是将近20年的历史,1997年,IBM(深蓝)战胜了国际象棋世界冠军Garry Kasparov,代表了基于规则的人工智能的首次胜利,2016年,谷歌的AlphaGo机器人在围棋比赛中击败了世界冠军李世石,至今维持不败战绩。如果要问未来20年,影响我们生活的最大技术驱动力是什么?答案就是人工智能(Artificial Intelligence)。

人工智能是指使用机器代替人类实现认知、识别、分析、决策等功能,对人类思维和推理过程的模拟、延伸和扩展,是一门综合了机器学习、云计算、大数据等前沿交叉学科技术。人工智能的过程就是机器模仿人类利用知识完成了一定行为的过程。按照是否能真正实现推理、思考和解决问题这一标准,人工智能分为“弱人工智能”和“强人工智能”,目前市场上的人工智能研发和应用主要集中于“弱人工智能”领域,即是实现特定功能的专用人工智能,如语音识别、图像处理、机器翻译等。

与传统的人工控制或遥控机器人相比,人工智能系统同样需要数据和计算,同样需要与人产生互动协作,但人工智能系统更高级之处,在于具有一定的自适应特性和学习能力,能够随环境、数据或任务的变化而自适应调节参数或更新优化模型,能够向“云、端、人、物”进行数字化连接并扩展、实现演化迭代,应对不断变化的现实环境,从“一器一用”向“一器百用”过渡,这就是“智能”的体现。

以上是对人工智能的整体介绍,下面我们以“拆文解字”的方式,再来剖析一下人工智能的各个方面:

1. 人工智能的“人”:可以理解为机器所替代的各种人类活动场景,由此派生出了各种结合人工智能应用场景,包括“AI+医疗”、“AI+金融”、“AI+物流”、“AI+制造”等各种领域。

在“AI+医疗”领域,人工智能技术在医疗影像辅助诊断、辅助诊疗、疾病预测、药物开发方面,能够有效提高医护人员的工作效率,降低漏诊率和误诊率。比如在医学影像领域,我国影像数据的年增长率约为30%,而放射科医师数量年增长率为4.1%,放射科医师有超过一半以上工作时间在 8小时以上,20%每日工作时间甚至超过 10小时,一个病人的肺部CT影像,看完需要15~30分钟,而通过人工智能技术的辅助,影像医生的工作效率可以提高3倍多。

在“AI+金融”领域,人工智能技术在智能获客、身份识别、大数据风控、智能投顾等方面都取得了一定的进展。以大数据风控为例,传统银行的风控打分还维持在在20~200个左右的模型变量,而基于深度学习的模型可以处理的特征变量多达7万个,通过人工智能的算法,模型还可以发现一些传统模型无法预警到的风险现象,比如,在美国市场的小额现金贷发放中,机器学习会发现贷款申请人在网上填表喜欢全部用大写字母的人违约率更高,或者在申请人月收入没有验证的情况下,申请人填写月收入超过7500美元以上的人违约率反而会提高,预示着一种可能存在欺诈的统计现象。

2. 人工智能的“工”:可以理解为“工效”指标,即KPI,这是衡量机器辅助或替代人类活动后工效指标。

通过人工智能能够非常明显提高工效的活动,除了上面提到的医学影像辅助诊断之外,客服行业也是一个非常好的案例,通过历史上积累的客服对话记录,人工智能技术能够在意图识别、命名实体识别、自动问答、用户画像等方面进行赋能,可以提高20%~30%的工时效率,通过人机充分协作,机器人不仅可以独立解决客户问题,还能辅助人工发挥重要作用,90%以上的问题将可以由机器人自主解决。

不仅仅在服务领域有“工效”问题,在智能硬件出也能体现中“使用效果”的提升,比如在2018年1月9日美国拉斯维加斯举办的国际消费类电子产品展览会(CES)上,一家Forward-X的公司就推出了一款可以跟随主人滑行的智能行李箱。这款行李箱采用面部识别技术、传感器与自动驾驶技术,可以避开障碍物,用摄像机和激光雷达进行定位,实时锁定并跟随主人。而且用户通过独特的手势控制功能就可以控制它。此外,智能行李箱还配备了一个警报腕带,如果有人试图偷走它就可以报警。有了智能旅行箱,出门旅行的双手是解放,带来了很好的“工效”提升。

3. 人工智能的“智”:是指人工智能的关键算法,即“机器学习”。

机器学习是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、脑科学等诸多领域的交叉学科,研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有知识结构并实现迭代,这是人工智能技术的核心。

基于数据的机器学习是从观测数据(训练集)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测,相关算法包括逻辑回归、支持向量机方法、三层人工神经网络方法、贝叶斯方法以及决策树方法等,按照学习模式划分,可分为以下3类

除了上述传统的机器学习之外,深度学习,又被称为深度神经网络(指数层超过3层的神经网络),是一个从2006年开始出现的新兴领域,其实质是给出了一个将特征表示和学习合二为一的方式,其特点是放弃了可解释性,只追求学习的有效性,目前两类典型的模型是卷积神经网络(CNN)和循环神经网络(RNN)

值得一提的是,近期机器学习本身也正在走向机器学习的阶段,这得益于谷歌在2017年推出的AutoML(Auto Machine Learning),即让AutoML系统自主编写机器学习代码,一种能够让AI生成AI的人工智能。从人工智能应用的角度看,谷歌AutoML平台将是一个非常方便的工具。如果单个企业定制人工智能方案,就要去定义算法,收集数据,通常要数个月或者数年才能完成。而谷歌AutoML平台可以自动生成模型,产品周期被大大缩短,企业的花费也会降低。

4. 人工智能的“能”:是指实现人工智能的运算能力,GPU的出现让并行计算成为可能,对数据处理规模、数据运算速度都带来了指数级的增长。

作为计算能力的物质基础,智能芯片被分别部署在云端和设备端,人工智能的训练和推理通常在云端芯片实现,而设备端芯片用来处理实时性要求很高的设备,比如自动驾驶的车载摄像设备。智能芯片主要是通用类的芯片,包括CPU、GPU、NPU、FPGA。