「人工智能」行业冉冉升起,送你一份「最全面」的研究报告

发布时间:2017-06-29

在不同的场景中,人工智能是如何发挥作用的?带着这个问题,我们研究了国内外与此领域相关的企业,写出了这份人工智能行业的研究报告。


文 | 孔德云 刘姝一 编者按:本文来自微信公众号“36氪”(ID:wow36kr),36氪经授权发布。

从去年的Alpha Go对战李世石开始,再到今年升级版的Alpha Go对战柯洁,人工智能经过一年多的发酵早已不再是一个陌生的名词。

截至目前,人工智能行业已发布了多篇报告,但我们仍致力于写出不一样的东西。除却老生常谈的算法、计算力、数据之外,我们认为人工智能的未来最重要的驱动力一定会是“场景驱动”。在人工智能的场景驱动阶段,不但可以针对不同用户做个性化服务,而且可在不同的场景下执行不同的决策,最终实现“给予决策支持”的目标。因此本报告中,我们用了较大的篇幅去描绘人工智能的场景应用。

那么,在不同的场景中,人工智能是如何发挥作用的?带着这个问题,我们研究了国内外与此领域相关的企业,写出了这份人工智能行业的研究报告。

在这份报告中,我们将主要探讨这几个问题

什么是“人工智能”?

它的驱动力是什么?

有哪些应用场景?

它的产业链上下游与市场规模又是怎样的?

对于一级市场的创业者来说,目前还有那些领域存在机会?


行业概述


AI是使用机器代替人类实现认知、分析、决策等功能的综合学科


人工智能(ArtificialIntelligence)是指使用机器代替人类实现认知、识别、分析、决策等功能,其本质是对人的意识与思维的信息过程的模拟,是一门综合了计算机科学、生理学、哲学的交叉学科。凡是使用机器代替人类实现认知、识别、分析、决策等功能,均可认为使用了人工智能技术。

作为一种基础技术,理论上讲人工智能能够被应用在各个基础行业(如AI+金融、AI+医疗、AI+传统制造业等),同时也有其如机器人这样具体应用行业的概念。

本报告将以2017年上半年为时间节点,对包括发展驱动力、巨头布局、投融资情况、预测的市场规模等在内的人工智能行业到目前为止的整体发展情况做简要分析,并对包括数据标记、语音识别、语义识别、计算机视觉等技术领域以及安防、医疗、金融等应用场景在内的细分领域及其典型企业进行简析,探索人工智能领域未来发展趋势和可能的投资/创业机会。

行业驱动力:技术驱动阶段-算法和计算力是主要驱动力


在AI发展的不同阶段,驱动力各有侧重,我们可以将AI的发展划分为三个阶段:技术驱动阶段、数据驱动阶段和场景驱动阶段。

技术驱动阶段集中诞生了基础理论、基本规则和基本开发工具。在此阶段,算法和计算力对AI的发展起到主要推动作用。现在主流应用的基于多层网络神经的深度算法,一方面不断加强从海量数据库中自行归纳物体特征的能力,一方面不断加强对新事物多层特征提取、描述和还原的能力。对算法来说,归纳和演绎同样重要,最终目的是提高识别效率。最新ImageNet测试结果显示,AI错误率低达3.5%,而人类对同一数据库识别错误率在5.1%1,理想情况下,计算机图像识别能力已超越人类。

如上图所示,每年在ImageNet测试中错误率最低的算法模型都不尽相同(从NEC到ResNet),这也反映了人们对于算法的不断探究、更迭过程。

计算力的三驾马车:芯片、超级计算机、云计算

提高识别效率除依靠算法之外,也离不开计算力的支持。计算力可以分三个维度展开:芯片、超级计算机、云计算。•芯片:人工智能领域作为一个数据密集的领域,传统的数据处理技术难以满足高强度并行数据的处理需求。为解决此问题,继CPU之后,相继出现了GPU、NPU、FPGA、DSP等“AI”芯片。1999 年,Nvidia公司发布了全球首款图片处理芯片GPU;2016年,寒武纪发布了全球首款深度学习专用处理器芯片NPU,芯片的更迭、进步可从根本上提高计算性能。

超级计算机:其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多,是一种超大型电子计算机。我国自主超级计算机“神威·太湖之光”,其处理器为众核CPU“申威26010”,整台“神威·太湖之光”共包含40960块处理器;打败李世石的AlphaGo共包含1202个CPU和176个GPU;打败柯洁的升级版AlphaGo使用到了TPU,但数量只有 4 颗。

可以发现,真正用于人工智能的超级计算机芯片还只是处于CPU、GPU层,如何将更适用于网络神经算法的NPU、FPGA等芯片量产化并融合入超级计算机芯片矩阵,是在人工智能发展的第一阶段—技术驱动阶段应该重点努力的方向之一。

云计算:与主要应用于密集型计算的超级计算机不同,云计算依靠其灵活的扩展能力主要应用于社交网络、企业IT建设和信息化等数据密集型、I/O密集型的领域。

我们分析认为,当AI跨越入第二阶段—数据驱动阶段后,算法和计算力将变成人工智能领域的基础设施—“水、电、煤”。就目前看来,多项算法开源平台已将AI算法引入统一、公用阶段,运算力也必将向同样的趋势发展。云计算则是一个初步尝试,未来,计算力的发展方向或将是云计算和超级计算机技术结合,为企业提供既可密集运算又可灵活扩展的计算服务,将人工智能赋能全行业。

数据驱动:描绘个性化画像;场景驱动:给予决策支持

人工智能发展的第二个阶段,算法和计算力已基本不存在壁垒,数据将成为主要驱动力,推动人工智能更迭。此阶段,大量结构化、可靠的数据被采集、清洗和积累,甚至变现。例如,大量的数据基础上可以精确地描绘消费者画像,制定个性化营销方案,提高成单率,缩短达到预设目标的时间,推动社会运行效率提升。

到了人工智能发展的第三个阶段,场景驱动作为主要驱动力,不仅可以针对不同用户做个性化服务,而且可在不同的场景下执行不同的决策。此阶段,对数据收集的维度和质量的要求更高,并且可实时根据不同的场景,制定不同的决策方案,推动事件向良好的态势发展,帮助决策者更敏锐的洞悉事件根本,产生更精准更智慧的决策。

人工智能产业链综述

AI产业链主要包括技术支撑层、基础应用层和方案集成层

正如报告开头所述,人工智能是指使用机器代替人类实现认知、识别、分析、决策等功能,是一门综合了计算机科学、生理学、哲学的交叉学科。完整的人工智能产业链可以分为技术支撑层、基础应用层和方案集成层,或者说应用场景层。

技术支撑层主要由AI芯片、传感器等硬件和算法模型(软件)和两部分构成。其中传感器与IoT的感知层相似,包括GPU、FPGA、NPU等在内的AI芯片负责运算,算法模型则负责训练数据。

基础应用层的技术则是为了让机器完成对外部世界的探测,主要由计算机视觉、语音识别等感知层和语义识别等认知层构成,这些技术是机器能够做出分析判断的基础。此外,在感知与认知技术之下还有数据标注作为其底层支撑。

方案集成层是集成了某种或多种基础应用技术的、面向如工业、自动驾驶、家居、仓储物流、金融、医疗等不同应用场景的产品或方案。

语音识别:语音识别过程虽存在难点,但目前技术已趋于成熟

语音识别是将语音转换为文本的技术,是自然语言处理的一个分支。前台主要步骤分为信号搜集、降噪和特征提取三步,提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码,最终把语音转化为文本,实现达到让机器识别和理解语音的目的。根据公开资料显示,目前语音识别的技术成熟度较高,已达到95%的准确度。然而,需要指出的是,从95%到99%的准确度带来的改变才是质的飞跃,将使人们从偶尔使用语音变到常常使用。

语音识别作为一种一维时域信号,在实际操作中主要有两个难点。首先是数据的获取、清洗。语音识别需要大量细分领域的标准化语料数据作为支撑,尤其是各地方言的多样性更是加大了语料搜集的工作量。据媒体消息,苹果iOS 10.3版本中Siri已支持上海话。

第二个难点是语音特征的提取,目前主要通过具备多层神经网络的深度学习来解决,多层的神经网络相当于一个特征提取器,可对信号进行逐层深化的特征描述,最终从部分到整体,从笼统到具象,做到最大程度地还原信号原始特征。

语音识别虽市场庞大但已出现领航者,留给创业公司的机会不多

据Research andMarkets研究报告显示,全球智能语音市场将持续显著增长,预计到2020年,全球语音市场规模预计将达191.7亿美元。根据Capvision报告显示,从语音行业市场份额角度来看,全球范围内,由Nuance领跑,国内则是科大讯飞占据主导地位。


语义识别:解决“听得懂”的语义识别领域中,新进入者仍具有一定机会

语义识别是人工智能的重要分支之一,解决的是“听得懂”的问题。其最大的作用是改变人机交互模式,将人机交互由最原始的鼠标、键盘交互转变为语音对话的方式。此外,我们认为目前的语义识别行业还未出现绝对垄断者,新进入的创业公司仍具备一定机会。


语义识别是自然语言处理(NLP)技术的重要组成部分。NLP在实际应用中最大的困难还是语义的复杂性,此外,深度学习算法也不是语义识别领域的最优算法。但随着整个AI行业发展进程加速,将为NLP带来长足的进步。

语义识别技术拥有多样性的应用领域以及行业参与者

我们认为,基于语音识别和语义识别的智能语音交互技术在车载场景中存在刚需,也会成为最先爆发的领域之一。并且,随着车联网的纵深化发展,相关硬件趋于免费,依靠语音交互天然流量入口,做个性化增值服务将是未来车载领域的主要盈利点。

从1996年至今,国内至今仍在运营的人工智能公司接近400家。从下图可看出,自然语言处理(NLP)无论在创业热度、获投数量还是获投金额都处于细分领域的前三。据 Global Market Insights数据,预计到2024年市场规模达到110亿美元。


人工智能技术支撑层

计算机视觉:计算机视觉主要研究如何使机器具备“看”的能力

计算机视觉(computer vision,简称CV)是指用计算机来模拟人的视觉系统,实现人的视觉功能,以适应、理解外界环境和控制自身运动。主要解决的是物体识别、物体形状和方位确认以及物体运动判断这三个问题。计算机视觉识别系统通常需要三个过程:目标检测、目标识别、行为识别,分别解决了“去背景”、“是什么”、“干什么”的问题。

计算机视觉在技术流程上,首先要得到实时数据,此步骤可通过一系列传感器获取,少部分数据可直接在具备MEMS功能的传感器端完成处理,大部分数据会继续传输至大脑平台,大脑由运算单元和算法构成,在此处进行运算并给出决策支持。

动态人脸识别是最热领域,金融和安防是最热场景

计算机视觉应用场景可分为两大类:图像识别和人脸识别,每类又可继续划分为动、静共四个类别,基本覆盖了目前计算机视觉的各项应用场景。其中动态人脸识别技术是目前创业热度最高的细分领域,尤其是金融和安防场景,是其重点布局场景。

国内,计算机视觉领域的企业最早出现在1997年,2014年出现创业高潮,企业平均年龄在3.9岁。下表格为该领域目前存续的具备代表性的创业公司。


人工智能的应用场景层

AI+医疗:融合目前主要体现在智能设备和识别诊断两方面

人工智能在医疗领域的应用,我们认为主要体现在“软”和“硬”两方面。“硬”指的是主要用于医院、诊所的医疗或辅助医疗的智能型服务机器人。种类包括手术机器人、假肢机器人、康复机器人、心理康复辅助机器人、个人护理机器人和智能健康监控系统等六大类。

手术机器人领域代表公司Intuitive Surgical成立于1995年,其产品达芬奇手术机器人是目前全球范围内应用最广泛、技术水平最高的手术机器人之一。达芬奇手术机器人属于人机协作型机器人,主要由医生控制台、机械臂系统、三维成像系统三部分构成。手术实施过程中,主刀医师不与病人直接接触,而是通过三维视觉系统和动作定标系统操作控制,由机械臂以及手术器械模拟完成医生的技术动作和手术操作。目前,整个手术机器人行业正在由大型开放性手术向人体微创精细型手术转型。

手术机器人行业急需打破垄断,降低成本,普惠国人

就全球而言,目前医疗机器人的研发与销售仍主要集中在北美地区。截至2016年6月,达芬奇手术机器人全球累计安装3745台,其中美国2474台,全球累计完成手术300万例。达芬奇手术机器人是国内唯一获批上市的医疗机器人,截至2016年12月,全国各地共引进了59台,2016年度共完成手术11445例,历年总计完成手术22917例,国内渗透率极低。

随着我国老龄化进程加速和中产阶级的崛起,人们对医疗的精准度、无痛化等要求逐步攀升,同时也由于医疗人员的稀缺,中国的医疗机器人的需求空间非常大。据OFweek消息,2021年,全球手术机器人市场规模将达200亿美元,手术机器人国产化已迫在眉睫。

AI+医疗衍生出的识别诊断领域中,数据是关键

在AI与医疗的软性结合上,具体应用包括诊前的疾病预防、健康管理;诊中的辅助诊断、医学图像处理;诊后的虚拟医护助手等。目前,发展较为成熟的领域有医学影像识别和智能诊断等。

算法和数据是医学影像识别和智能诊断的技术基础,其中,医疗垂直领域的图像算法和自然语言处理技术已可基本满足行业需求,而数据方面例如医学影像数据、电子病历等,存在各医院之间信息不流通、企业与医院之间合作不透明等问题,使得技术发展与数据供给之间存在矛盾。

但随着全球医疗保健进入数字化拐点,可授权使用的数据量得以快速增长,另一方面也由于医疗机器人这类新的医疗数据终端的逐步普及,都将为智慧医疗行业带来新的发展契机。

政策鼓励+需求爆发,大健康领域或将出现更多创业者加入

基于数据的稀缺性,拥有一手医疗数据、和政府、医疗机构有大量渠道的创业公司将会建立起壁垒。或者通过对拥有数据的企业进行全资收购也是快速壁垒的好方式。目前,AI+医疗的软性应用方面的主要玩家国外有IBM Wastson,国内有碳云智能、推想科技等。

2015年,国务院发布《关于印发全国医疗卫生服务体系规划纲要(2015年—2020年)》,提出推动惠及全民的健康信息服务和智慧医疗服务,推动健康大数据的应用,逐步转变服务模式。IDC预计,2017年国内医疗行业IT花费市场规模将达到336.5亿元,2012至2017年的年复合增长率为14.5%,增速高于中国IT市场的平均增速,需求旺盛。

整体而言,医疗“软”市场急需医疗数字化、开放化,“硬”市场需要大量创业者加入共同开发医疗机器人这片国内蓝海。

AI+金融:AI技术的融入,赋予了金融行业更多想象力

从信息技术变革角度来看,金融历经金融IT、互联网金融到金融科技三大发展阶段。金融IT,通过 IT 软硬件实现传统金融机构办公和业务电子化;互联网金融,利用互联网实现资产端、交易端、支付端、资金端等互联互通,达到信息共享和业务撮合;金融科技,通过大数据、云计算、人工智能、区块链等最新技术,提高金融业务的智能化。

人工智能与金融的结合可从以下三方面展开说明

生物特征识别功能:一方面活体验证降低了隐藏风险,一方面远程身份验证提升了工作效率。

千人千面、精准营销:基于大数据、机器学习、标签计算,实现实时精准画像描绘,提供个性化营销是未来趋势之一。进一步还可发展为智能投顾、辅助量化交易等。

大数据征信、普惠金融:基于大数据的征信系统弥补了中小型企业的征信空白,扩大了客户范围的同时,也提升了金融机构的风控能力。

人工智能行业总结

深度算法、计算力、数据量以及应用场景共同推动AI迎来爆发期

自从1956年美国计算机协会组织的达特莫斯(Dartmouth)学会上提出“人工智能”一词,这个概念随着众多理论、技术和应用的出现而被不断丰富。经过半个多世纪的发展,人工智能已经成为时下最为热门的话题之一,“AI”与“AI+”亦成为一级市场的最火热的创业/投资领域。

在经历了诞生、黄金时代、遭遇障碍、繁荣、低潮等数个阶段之后,人工智能迎来了爆发期。总结本次AI爆发的驱动力主要是包括目前主流应用的基于多层网络神经的深度算法和以及包括芯片、超级计算机、云计算等在内的计算力等。此外,被记录下的海量数据和越发丰富的应用场景也同样推动了AI爆发期的到来。