首页 > 资料专栏 > IT > IT技术 > 人工智能 > TalkingData_2018数据智能生态报告_2018.10_25页

TalkingData_2018数据智能生态报告_2018.10_25页

antao
V 实名认证
内容提供者
热门搜索
资料大小:2247KB(压缩后)
文档格式:WinRAR
资料语言:中文版/英文版/日文版
解压密码:m448
更新时间:2019/8/17(发布于河北)
阅读:1
类型:积分资料
积分:25分 (VIP无积分限制)
推荐:升级会员

   点此下载 ==>> 点击下载文档


文本描述
1
前言
随着智能移动设备、可穿戴设备、工业大数据等的指数级增长,数据行业迎来更多的挑战。大数据、
云计算、人工智能、区块链、机器学习等各种热词蜂涌而出。如今,大数据的概念已经普及,
从互联网、数据企业,到传统实体企业,数据正在融入到整个经济的发展中,2018年第五届中
国国际大数据大会正以“实体融合新动能 数字经济新发展”为主题,共同探讨数据所产生的决
策与价值。而如何真正从数据中形成智能,提升商业决策与人类生活?这是所有大数据企业共
同面临的挑战
数据智能(data intelligence)一词相较于大数据和人工智能而言更为年轻,但是数据智能的诞
生却和这两个由来已久的概念密不可分。简单讲,数据智能就是大数据和人工智能技术的融合
数据智能应用的终极目标是利用一系列智能算法和信息处理技术实现海量数据条件下的人类深
度洞察和决策智能化,最终走向普适的人机智能融合。它代表着一种新的认知范式,超越了简
单的“是什么”和“为什么”,即Jim Gray(图灵奖得主,关系数据库的鼻祖)所述的第四个
认知范式1:随着数据量的高速增长,计算机将不仅仅是模拟仿真,还能进行分析总结,得到结论,
最终实现预测
数据智能作为数据行业的新兴概念,在整个数据行业会引起怎样的变化?数据智能企业作为新
的物种,会如何改变数据行业的价值分配和竞争全景?数据智能中台作为数据智能的最重要的
技术与机制,其核心的特点和能力是什么?在本报告中,作者试图从数据智能、数据智能平台
的定义和本质入手,回顾数据智能市场的发展历史,针对现实客户企业遇到的各种问题,提供
当前竞争格局下的玩家分类和速赢策略。对于数据智能的发展趋势,本报告也力图从各个利益
相关者的角度出发,给出相应的应对策略,帮助企业更好的驾驭数据智能,领跑数据智能时代
1几千年前的科学,以记录和描述自然现象为主,称为“实验科学”,即第一范式,其典型案例如钻木取火;
数百年前,科学家们开始利用模型归纳总结过去记录的现象,发展出“理论科学”,即第二范式,其典型案
例如牛顿三定律、麦克斯韦方程组、相对论等;过去数十年,科学计算机的出现,诞生了“计算科学”,对
复杂现象进行模拟仿真,推演出越来越多复杂的现象,其典型案例如模拟核试验、天气预报等,即第三范式数据智能时代,人工智能后时代:内涵和预测
数据智能和数据智能平台是什么
从技术的角度来看,数据智能是指基于大数据引擎,通过大规模机器学习和深度学习等技术,
对海量数据进行处理、分析和挖掘,提取数据中所包含的有价值的信息和知识,使数据具有“智
能”,并通过建立模型寻求现有问题的解决方案以及实现预测等。这其中,由于需要实现处理
海量和异构化的数据,数据智能需要有一个强大的实现的平台。这个平台,能够进行实时数据
处理、分析和挖掘,提取数据中所包含的、具有商业情境价值的信息和知识,形成不同的情境
化数据能力,并通过建立模型、构建流程和数据产品,最终实现自动决策。我们可以把这样的
平台称为“数据智能平台”
在数据智能概念诞生之前,常用的数据应用概念有数据科学(data science)和数据分析学
(datalogy)等。虽然数据智能与这些概念有重合之处,但“数据智能“之所以成为一个独立的概念,
是因为包含了以下几个原因:
1.数据智能的目的是“预测”和“决策”,而非“分析”或者“展示”:数据智能一定是为了
服务某个现实中的决策,所以不仅仅是需要用机器去模拟现实数据、抽象现实问题,还需要进
一步用数据将隐藏在现实问题之下的关系抽象出来,并形成关系发展趋势的预测,进而指导行动
因此数据智能中的数据最终是可行动的,可以转化成决策的
2.数据智能是可被衡量价值的:由于数据智能是决策导向的,所以数据智能效率和价值的评判,
即在于基于该决策的结果价值如何。因此,数据智能的核心测量指标是能够自证其价值,可以
与人类的决策使用同一套判断标准,以比较效用差别,例如利润率,投入产出比等
3.数据智能得以实现的技术核心是数据智能平台:数据智能是一系列能力的集合,所以数据智
能的产生是一项复杂的系统工程。一般而言,数据智能平台在数据智能的产出过程中是必须的,
其作用是承载和调动一系列智能数据(面向特定商业情境和问题的数据集)、核心模型(包括
了商业逻辑方法论,由人的智慧+机器学习优化而得的模型)、以及一系列的面向不同情境的
数据处理能力——例如大规模机器学习和深度学习等技术,提高数据智能产生的效率
4.数据智能的呈现载体是数据智能产品:数据智能产品是针对某一个商业情境中的某一类特定
决策,并且与该商业决策流程相对应的产品,是有封装的、有交互界面(产品界面)的。数据
智能产品是数据智能的媒介和呈现载体,其效率和效能代表了数据智能产品的价值几何。数据智能的经济学本质
经济学的本质是决策,解释的就是“选择”的效率和效用。能够解决“决策”问题的才是真正的“智
能”,因此在当今数字经济快速改变商业竞争的时代,数据智能具有极大的经济意义。数据智
能本质上是通过以下几个方面对经济产生正向的促进作用:
1.降低交易成本,提高决策效率:数据智能加快了从信息汇聚到决策的效率,极大提炼了数据
的内涵,降低信息不对称,减少由于时间压缩不经济带来的专业信息获取成本
2.打破有限理性,提高决策稳定:由人做决策的时候获取的信息来源和处理能力不同,每个人
受到非理性因素的影响程度不同;数据智能的决策过程都是由算法完成,输出较为稳定,保证
了理性稳定的决策产出;减少了不确定性带来的风险和损失
3.替代重复决策,增加价值创造:用机器替代重复性的、可打包成“黑箱”的决策,能极大地
提高决策的频次,解放人的智慧,这将极大地提高交易的频次,提高价值创造的次数。进一步的,
这将在整个经济系统内部形成新的岗位、生产关系,以及价值分工
不仅如此,数据智能平台的存在还会提高数据智能价值创造的能力,内生性的提高数据智能的
经济价值,因此,数据智能平台可以将整个平台上数据的价值(以对应特定商业情境的可获得
数据形成的数据集存在)和人的智慧(对于行业的业务理解)成倍的放大,我们可以粗略地估
计一个数据智能价值公式:
数据智能价值=(数据+人的智慧)×数据智能平台
甚至数据智能平台的加速作用不是乘数效应而是指数效应,这个公式可以转变为:
数据智能价值=(数据+人的智慧)
那么数据智能平台/数据中台的价值是从何而来呢?我们可以看成是两种效应的加和:
1.第一种效应是提高资源配置效率,收集各个环节的剩余价值。从传统数据价值链的角度来说,
也会存在一个“微笑曲线”:由于大量开源工具的出现,数据的加工与分析算法的趋同使这两
个环节的附加价值不断降低;而数据的供给侧与最后的应用、产品解决方案则会成为附加价值
最高处。因此,占据特别的数据来源,或者发现适合数据智能解决的实际需求,并进一步研发
成应用或数据智能产品,将成为价值最高的环节。而数据智能平台则打通了这个数据价值链上
的各个环节,让所处不同生命周期阶段的行为发生在更应该发生的地方,提高资源配置效率,
通过平台汇聚和沉淀,将剩余价值集中在平台上
数据智能平台数据产品
智能应用
数据生产化
工程化
数据分析
和建模
数据加工
聚集平台
数据源
传统数据价值链
图表 1 数据智能平台/数据中台的价值效应一:提高资源配置效率,集中剩余价值
图表 2 数据智能平台/数据中台的价值效应二:降低成本,增加整体产出
2.第二种效应是提高资源的配置效率,提高各个环节的价值产出。在数据智能时代,数据的价
值链远远比传统价值链复杂,如下图所示,仅仅是从数据的采集、获取到治理,就有近十个环
节纵横交错、环环相扣。数据流过数据智能平台的过程可以按照数据生命周期来划分(数据的
加工程度),在这个过程中,每一个环节数据智能平台都能提供相应的处理能力、工具、补充
的数据集或者解决方案,数据能够无缝的、成阶段递进的在数据智能平台内逐渐由原始数据变
成最后可行动的(actionable)数据。由于数据智能平台上这一揽子能力和工具能极大提高可复
用环节的复用程度,降低不必要的重复投入和内耗,因而能让更多价值融入到数据智能、数据
智能产品本身,提高整体的产出
机器学习代码
配置
数据采集
数据校验
机器资源管理
服务基础架构
监控
分析工具
特征提取
过程管理工具
数据智能时代的数据价值链
数据智能平台(数据中台)的概念和特点
数据智能平台的概念往往包括了平台本身和运行平台的机制,本质是通过能力的共创、复用、
沉淀等,促进前端业务或者数据智能产品的效率、协同、创新(如下图表2所示)。数据智能。