【威尼斯在线平台】硬核干货一文打尽,史上最

日期:2019-09-15编辑作者:威尼斯在线平台

原标题:信通院AI白皮书:硬核干货一文打尽,从技术流派到应用趋势【附下载】| 智东西内参

来源:智东西 

智东西(公众号:zhidxcom)

Mr L

编 | 十四

随着科技的进步,人工智能的发展愈发火热,AI、大数据、机器人这些词已经渗透进我们生活的方方面面,我们有理由相信AI是下一个带来巨大经济效益、提高社会生产力的突破口。下面这篇文章整理了高盛的人工智能重磅报告,从AI的技术支撑、产业布局、市场规模等角度为我们带来详实的分析。

自2016年AlphaGo击败李世石之后,人工智能(AI)这个再度翻红的科技热词已经在争议声中走过了两年多。这两年里,从一键美颜、刷脸开机,到编辑快讯、演唱会抓逃犯,人工智能正在突破次元壁,落地现实。

Mr L

人工智能的战略重要性不仅吸引了科技巨头和资本的疯狂投资,养活了一众创企,更是得到了各国顶层支持。

智东西  编|十四

我国继去年7月发布了《新一代人工智能发展规划》,11月公布了首批国家人工智能开放创新平台名单之后,工信部本周三又公示了2018年人工智能与实体经济深度融合创新项目名单(覆盖106个项目)。

人工智能(AI),可以说是科技信息时代的大飞跃,既具备一定的类人逻辑性,又具备强大的计算能力和数据存储能力。虽然,目前业界并不处在一个良好的投资状态,但AI技术依旧被认为是下一个带来巨大经济效益,提高社会生产力的巨大突破点。

本期的智能内参,我们推荐来自中国信息通信研究院和中国人工智能产业发展联盟的人工智能发展白皮书(技术架构篇),从产业发展的角度,分析技术现状、问题以及趋势,盘点智能语音、语义理解、计算机视觉等相关应用。如果想收藏本文的报告(信通院-人工智能发展白皮书2018),可以在智东西(公众号:zhidxcom)回复关键词“nc285”获取。

事实上,在过去的这两年时间里,AI、机器人、自动驾驶等概念已经成为最前沿的文化、政治名词。很多研究认为,我们目前正处于这样一个技术拐点:计算能力更强更快,数据源更丰富,深度学习算法趋于成熟,专业的硬件(芯片)和开源代码逐渐崛起,越来越多的实用性AI应运而生。本期的智能内参,我们推荐来自高盛的AI产业调研报告,报告详细介绍了AI的技术背景、应用前景和目前的产业竞争局势及产业链地图。以下为智能内参整理呈现的干货:

以下为智能内参整理呈现的干货:

AI背后的三大推手:数据、芯片、算法

威尼斯在线平台 1

移动网络大量普及 数据结构化或爆发

威尼斯在线平台 2

数据可以说是机器学习的关键。分布全球的无所不在的互联设备,包括移动设备、物联网等,使得非结构化的数据大量增长,也就是说,机器学习算法能够用来模拟、训练和测试的数据源更加充足。

威尼斯在线平台 3

仅以特斯拉互联汽车为例,截至目前,特斯拉总行程78000万英里,公司平台额外驱动的互联汽车也行驶了 100万英里。无线运营方面,Verizon8月公布了新的传输标准,使得远程传感器联通云端软件的速度更快。同时,新的5G网络也将促进传输数据,IDC预计截至2020年,年均数据量将达44泽字节(也就是44万亿字节),未来五年复合年增长率将达141%,大数据技术将逐渐渗透实用领域。

AI技术流派

与此同时,移动网络建立大规模数据库和云端处理技术的成本也在不断降低。智东西也曾在111期智能内参援引世界经济论坛指出:预计不用三年,将有90%的人拥有被广告商支持的无限的免费数据存储。这是因为,硬盘驱动器的成本持续下降,激励着数据的创造。事实上,近90%的数据是过去两年中创建的。

让机器实现人的智能,一直是人工智能学者不断追求的目标,不同学科背景或应用领域的学者,从不同角度,用不同的方法,沿着不同的途径对智能进行了探索。其中,符号主义、连接主义和行为主义是人工智能发展历史上的三大技术流派。

IDC调研的数据量增长趋势

符号主义

GPU应用大势 新硬件更适配并行结构

符号主义又称为逻辑主义 ,在人工智能早期一直占据主导地位。

GPU被认为是低成本、高计算能力的处理单元,特别是针对云端服务和新的神经网络结构,它能提高准确性和计算速率。基于GPU的并行结构允许更快的机器学习培训体系,远远优于目前广泛使用的基于CPU的数据架构。此外,通过额外的显卡网络,GPU体系可以加快迭代,实现更为精确的快速培训。

该学派认为人工智能源于数学逻辑,其实质是模拟人的抽象逻辑思维,用符号描述人类的认知过程。早期的研究思路是通过基本的推断步骤寻求完全解,出现了逻辑理论家和几何定理证明器等。

基于GPU的云运算

上世纪 70 年代出现了大量的专家系统,结合了领域知识和逻辑推断,使得人工智能进入了工程应用。PC 机的出现以及专家系统高昂的成本,使符号学派在人工智能领域的主导地位逐渐被连接主义取代。

芯片浮点能力发展之快可以以NVIDIA GPU(GTX 1080)为例:该芯片性能为9T浮点运算,价值约700美元,也就是每G约8美分。参考1961年的IBM 1620,不考虑浮点运算能力的话,通过串联实现的每G浮点运算需耗9万亿美元。

连接主义

智东西也曾在102期智能内参中强调GPU的市场前景,并分析市场份额。相比于CPU,GPU 具有数以千计的计算核心,及强大、高效并行计算能力,可实现 10-100倍应用吞吐量,特别适用于AI 海量训练数据情形。目前深度学习解决方案几乎完全依赖 (NVIDIA的)GPU。

连接主义又称为仿生学派 ,当前占据主导地位。该学派认为人工智能源于仿生学,应以工程技术手段模拟人脑神经系统的结构和功能。

于AI 海量训练数据情形。目前深度学习解决方案几乎完全依赖 (NVIDIA的)GPU。

连接主义最早可追溯到 1943 年麦卡洛克和皮茨创立的脑模型,由于受理论模型、生物原型和技术条件的限制,在 20 世纪 70 年代陷入低潮。

超级计算机浮点指数增长趋势

直到 1982 年霍普菲尔特提出的 Hopfield 神经网络模型和 1986年鲁梅尔哈特等人提出的反向传播算法,使得神经网络的理论研究取得了突破。

千兆次浮点运算所需成本变化趋势

2006 年,连接主义的领军者 Hinton 提出了深度学习算法,使神经网络的能力大大提高。2012 年,使用深度学习技术的 AlexNet模型在 ImageNet 竞赛中获得冠军。

算法不断优化 大公司推动开源

行为主义

越来越多的算法研究推动着深度学习的实用性,伯克利、谷歌、Facebook也纷纷公开自家的源代码框架,也就是Caffe、TensorFlow和Torch。源代码的开放吸引着越来越多的软件开发者尝试新的算法,不到一年,TensorFlow就以及该形成了一个活络的存储库GitHub,作为目前最大的开发商合作网站。当然,并不是所有的AI都出自于开源框架。

行为主义又称为进化主义,近年来随着 AlphaGo 取得的突破而受到广泛关注。

AI进程时间表

该学派认为人工智能源于控制论,智能行为的基础是“感知—行动”的反应机制,所以智能无需知识表示,无需推断。智能只是在与环境交互作用中表现出来,需要具有不同的行为模块与环境交互,以此来产生复杂的行为。

AI产业的三大类布局

在人工智能的发展过程中,符号主义、连接主义和行为主义等流派不仅先后在各自领域取得了成果,各学派也逐渐走向了相互借鉴和融合发展的道路。特别是在行为主义思想中引入连接主义的技术,从而诞生了深度强化学习技术,成为 AlphaGo 战胜李世石背后最重要的技术手段。

从技术更新周期来看,过去50年,计算机在摩尔定律的推动下不断进步,仅仅在系统框架方面,计算能力、存储容量带宽、编程语言转换都有很大的进展。参见90年代技术变革带来的经济繁荣,推动了软件、硬件、网络公司的整改。公共软件公司1995至今市值从2亿美元暴涨到5亿美元,只有2000年左右趋于平缓。显然,AI也有这样的趋势,引领硬件、软件、数据和服务提供商等领域的增长。事实上,谷歌、亚马逊、微软和Salesforce自2014年来就已经完成了17起AI相关的收购。

深度学习一招翻红

2014年以来的AI相关收购项目

可以说,本轮人工智能的发展,是在大数据环境和计算能力大幅提升的基础上,由深度学习带动的。

AI风投增长趋势

深度学习全称深度神经网络,本质上是多层次的人工神经网络算法,即从结构上模拟人脑的运行机制,从最基本的单元上模拟了人类大脑的运行机制。目前,深度学习已经在计算机视觉、语音识别、自然语言理解等领域取得了突破(详情参考第209期智东西内参)。

目前,科技大佬和风投人主要关注的有三个方面:DIY,也就是自主建立自己的人才和数据库,推出新的AI栈,主要玩家包括微软、谷歌、亚马逊和百度;咨询服务,为垂直和特定的领域提供专业的AI咨询,如IBM的沃森;开发服务型AI(AI-aaS),如谷歌图片识别模型。

威尼斯在线平台 4

人工智能系统框架示意图

威尼斯在线平台 5

AI栈的演化

▲深度学习已在多领域实现突破

DIY趋势:云平台和开源

深度学习分为训练(training)和推断(inference)两个环节。训练需要海量数据输入,训练出一个复杂的深度神经网络模型。推断指利用训练好的模型,使用待判断的数据去“推断”得出各种结论。

高盛咨询了各大公司和风投机构,总结认为,AI或者机器学习(ML)将被互联网公司大量的使用,这就需要有效数据收集和相关人才稀缺。不过,随着移动互联设备和物联网的普及,数据量越来越多,数据收集变得越来越容易。

大数据时代的到来,图形处理器(GPU)等各种更加强大的计算设备的发展,使得深度学习可以充分利用海量数据(标注数据、弱标注数据或无标注数据),自动地学习到抽象的知识表达,即把原始数据浓缩成某种知识。

目前,AI堆栈与其他前沿技术最大的区别在于,大部分的机器学习严重依赖于开源技术和基于云平台供应商的服务。这是因为,AI和ML需要大量数据支持,并且按需计算。目前,AI主要的基础技术投资都来自于微软、谷歌、亚马逊等云服务提供者,其中,云运算的首选是GPU和FPGA,它们能够进行并行的,快速的数据处理。很多公司都会购买这些开源或者云服务来帮助开拓客户,减少运营成本。

威尼斯在线平台 6

主要的开源项目

▲基于深度学习的人工智能技术架构

咨询服务:资本弥补技术差距

当前,基于深度学习的人工智能算法主要依托计算机技术体系架构实现,深度学习算法通过封装至软件框架的方式供开发者使用。

人才缺乏为IBM、埃森哲和德勒等公司的资讯服务营造了市场环境。因此,机器学习的相关人才有着非常大的机遇,甚至有组织举行数据科学大赛,提供奖励。

软件框架是整个技术体系的核心,实现对人工智能算法的封装,数据的调用以及计算资源的调度使用 。为提升算法实现的效率,其编译器及底层硬件技术也进行了功能优化。

机器学习人才招聘状况

威尼斯在线平台 7

AI-aaS:或将造就最大蓝海

▲深度学习技术体系概述

AI需要独特的数据集和专业的人才,这似乎使得五年内看到大量AI公司成为一件奢望。事实上,最可能的情况是,公司们利用AI提供商的数据和框架等来创造附加价值的AI服务,也就是API,研发AI应用程序是最基本的例子,尤其是图像识别和语音识别等。目前,谷歌和微软都提供收费API,开发者可以讲该API嵌入自己的应用程序,提高产品定位和水平。

人工智能算法的设计逻辑可以从“学什么”(表征所需完成任务的函数模型)、“怎么学”(通过不断缩小函数模型结果与真实结果误差来达到学习目的)和“做什么”(回归、分类和聚类三类基本任务)三个维度进行概括。

AI-aaS应用于垂直领域可以帮助大公司组合数据,构建机器学习模型,卖给合作伙伴或者客户、供应商。初创公司也可以据此构建专门的数据集,用于诸如医学成像、广告、零售等领域。

威尼斯在线平台 8

值得注意的是,除了这些高端技术层面,跟我们更为密切的AI应用即聊天机器人(聊天程序,bots),这被认为是未来人机交互的入口,尤其是自然语言识别、讯息平台和虚拟助手,是目前技术关注的关键点。

▲人工智能主要算法分类

AI-aaS案例

近年来,随着AI算法在多领域的突破,相关算法的理论性研究持续加强,新算法如胶囊网络、生成对抗网络、迁移学习等,也被不断提出。

AI-aaS API及价格

威尼斯在线平台 9

2025年:五大领域的千亿级市场

▲人工智能新算法

AI农业规模达200亿美元

下文将概述围绕深度学习的五方面技术现状和发展趋势。

基于传感器和卫星等技术提供的有效的视听数据,机器学习有望帮助增加作物产量(即繁殖能力),减少肥料和灌溉成本,协作作物和牲畜疾病的早期检测,降低劳动力成本,帮助收获后进行分类物流,进入市场。

大佬开源造生态

机器学习用于农业

如前所述,软件框架是整个技术体系的核心,是算法的工程实现。当前,人工智能基础性算法已经较为成熟,各大厂商纷纷发力建设算法模型工具库,并将其封装为软件框架,供开发者使用。

金融服务规模达340-4302亿美元

企业的软件框架实现有闭源和开源两种形式:苹果公司等少数企业选择闭源方式开发软件框架,目的是打造技术壁垒;目前业内巨头基本都是基于自身技术体系的训练及推断软

机器学习和人工智能在金融服务行业有广泛的应用,随着数据集的丰富,AI可以用于投资决策、信贷风险概况等,利用更少的时间处理更为丰富全面的市场信息,提供专业可观,甚至更准确的分析。

件框架,将开源深度学习软件框架作为打造开发及使用生态核心的核心。

AI用于金融服务

威尼斯在线平台 10

AI医疗每年能省540亿美元

▲人工智能开源平台对比(援引招商证券)

机器学习在医疗方面的可用性非常广,能够提供实时监测,帮助发现高回报的技术和药物,帮助测试分析、优化治疗。预计随着机器学习的人工智能的技术逐渐成熟,将推动药物研发过程,每年减少260亿成本支出,同时还能驱动医疗信息高效化。

总体来说开源软件框架在模型库建设及调用功能方面具有相当共性,但同时又各具特点。业界目前主要有深度学习训练软件框架(TensorFlow、MXNet等)和推断软件框架(Caffe2go等)两大类别。

未来十年医疗AI的投资回报率

当前开源软件框架的技术发展呈现出以下几方面的特点:

AI在医疗领域的应用

1、谷歌与其他公司间持续竞争。巨头公司在技术上将积极探寻包括模型互换,模型迁移等技术联合,以对抗谷歌公司。例如脸书(Facebook)和微软已经合作开发了一个可互换的人工智能软件框架解决方案。

零售业年均消费540亿美元省410亿美元

2、开源软件框架在向统一和标准化方向发展。随着人工智能应用的爆发,开发人员在不同平台上创建模型及部署模型的需求愈发强烈,在各类软件框架间的模型迁移互换技术研发已经成为重点。

线上对线下已经被证实是对传统零售业的挑战,电子商务可以积累大量的客户信息,基于这些数据,AI零售可以帮助企业更好的为目标客户服务,更有效的传递产品信息。

3、更高级的 API 逐渐占据主导地位。以 Keras 为例,它是建立在TensorFlow、Theano、CNTK、MXNet 和 Gluon 上运行的高级开源神经网络库,以其高级 API 易用性而得到了广泛的使用。

全球电子商务发展趋势

4、模型的集群并发计算成为业界研究热点。当前人工智能网络对于单计算节点的算力要求过高,但当前主流开源软件框架对于模型分割进行计算并没有实现,而这个问题也将随着应用场景的不断丰富而不断引起重视,成为开源软件框架下一个核心竞争点。

AI为能源工程节约1400亿美元

编译器解决适配问题

石油和天然气行业的探测和采炼有时处在极端条件,因此设备和工艺的可靠性很重要,影响着项目的经济效益。为了避免操作失误,这个行业往往采用了过渡冗杂的工程化设备和过多的人力。事实上,AI可以帮助设计更为可靠的设备和流程,降低资本支出和运营成本,预计未来时间,基于AI的能源工程可以帮助节省1400亿美元的开支。

在实际工程应用中,人工智能算法可选择多种软件框架实现,训练和开发人工智能模型也可有多种硬件选项,这就开发者带来了不小的挑战。

从能源产业结构看可出AI的潜力

原因一是可移植性问题,各个软件框架的底层实现技术不同,导致在不同软件框架下开发的模型之间相互转换存在困难;二是适应性问题,软件框架开发者和计算芯片厂商需要确保软件框架和底层计算芯片之间良好的适配性。

巨头的游戏:软件与硬件之歌

威尼斯在线平台 11

智东西第102和107期智能内参详细介绍过目前各大科技巨头在AI产业上的布局,可以看到,硬件、开源算法、云服务已经成为必争之地。

▲编译器解决软硬件适配问题

谷歌:贯彻软硬件结合的理念

本文由威尼斯在线平台发布于威尼斯在线平台,转载请注明出处:【威尼斯在线平台】硬核干货一文打尽,史上最

关键词:

Mapillary四项世界第一,旷视科技包揽COCO

这次联合挑战赛中, COCO 4项比赛,Mapillary 2 项比赛,共计 6 个赛项。 旷视科技参战其中的 3 项COCO 比赛和 1 项 Mapil...

详细>>

威尼斯在线平台Day最新攻略,亚马逊又关闭一项

原标题:突发!亚马逊又关闭一项重要功能,秒杀活动申请进入倒计时 Prime day 是亚马逊一年一度的购物狂欢日,除了...

详细>>

袁隆平等7人获2018前景正确大奖,他们赢得了

科学类微教徒人号“知识分子”在《2018前景科学大奖:......何人是林本坚?》称,“包罗英特尔等在内的一大批判国...

详细>>

Tencent优图进级为CV研究开发宗旨,优图实验室进

原标题:内部赛马胜出?腾讯优图升级为CV研发中心,加大投入且不设KPI 原标题:优图实验室升级为腾讯计算机视觉...

详细>>