会员中心     
首页 > 资料专栏 > 经营 > 管理顾问 > 咨询综合 > 艾瑞咨询2016年中国数据驱动型互联网企业大数据产品研究报告

艾瑞咨询2016年中国数据驱动型互联网企业大数据产品研究报告

资料大小:3451KB(压缩后)
文档格式:WinRAR
资料语言:中文版/英文版/日文版
解压密码:m448
更新时间:2018/8/7(发布于上海)

类型:积分资料
积分:10分 (VIP无积分限制)
推荐:免费申请

   点此下载 ==>> 点击下载文档


文本描述
iresearch
中国数据驱动型互联网企业大数
据产品研究报告
2016年内容综述
聚焦网络媒体大数据,研究其体系架构及相关产品
进阶;
类型共同构成;
数据的流通和共享将成趋势;
点,数据管理向垂直行业分化;
成熟,视频分析存在探索空间;
解决方案发展,定制化将成趋势

获取与处理;
领跑者。1)已上市互联网企业中,以
BAT为首的数据驱动型媒体整体表现较
好;2)未上市互联网企业中,数据驱动
型企业成为领跑者;
体更加广泛;2)移动端使用时长占比超
77%,信息采集更加丰富连贯;3)场景
化特征为大数据发展带来新契机;
的应用提出更高要求

政策推动产业发展进程;2)将自
主研发与投资收购相结合,技术推
动企业发展;
服务的发展策略相对成熟;
态系统雏形已成,多维度输出大数
据能力;
务为起点,推进产业生态形成

本报告将聚焦于中国网络媒体,研
究其大数据体系架构及相关产品,
探讨大数据发展趋势

大数据
Data
来源:艾瑞咨询研究院自主研究及绘制

互联网大数据
Internet
网络媒体大数据
Media中国大数据产业现状分析1
中国网络媒体大数据产业分析2
中国网络媒体大数据企业分析3
中国网络媒体大数据的机遇与挑战4大数据定义与特征
4V:数据规模大,数据流转快,数据类型多,价值密度低
抽样数据 全量数据
精确数据 混杂数据
因果关系 相关关系
数据类型多
—————————
除了以文本为主的结构化数据、
以网页数据为代表的半结构数据,
也存在大量网络日志、音频、视
频、图片、地理位置信息等非结
构化数据

Variety
数据流转快
—————————
1秒定律:要在秒级时间范围内
给出分析结果,超出这个时间,
数据就失去价值了

Velocity
大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。为了适应数据量的爆发式增长,
数据处理方式正逐步向全量性、混沌性及相关性发展。为了避免信息损失,越来越多的场景倾向于对全量数据进行挖掘与
分析,其中,只有一小部分数据是结构化的,而非结构化数据中同样蕴含着大量信息,因此,能够处理各式各样的混杂数
据的大数据技术得到了广泛应用和迅速发展。其中,占据着重要地位的大数据预测分析,也从主要基于因果关系进行分析
发展成了建立在相关关系的基础上的分析模式

Volume
数据规模大
—————————
IDC预计,到2020年,全球新建
和复制的信息量将达到44ZB,
中国数据量将超过8ZB

Value
价值密度低
—————————
海量数据中,如何通过强大的机
器算法,更迅速有效地完成数据
的价值“提纯”,已成为目前大
数据背景下亟待解决的难题

来源:艾瑞咨询研究院自主研究及绘制。大数据集成与存储
数据仓库基于企业整体建立,是大数据集成和存储的基础
作为大数据集成与挖掘的基础,数据仓库是在企业范围内共享准确一致的集成数据、针对分析需求进行数据重组的工具,
基于整个企业的数据模型建立。而数据集市基于单个部门或业务主题建立,为部门业务运行提供数据服务,可以根据仓库
建设也可以独立建设,形成从属数据集市和独立数据集市。所有的从属数据集市都从属于同一个数据仓库,各子系统的数
据均能保持一致。而每个独立数据集市都从各源应用环境中单独提取数据,独立拥有硬件平台、软件平台、数据和应用程
序,彼此没有任何约束,无法保证数据的一致性,从长远来看,既不稳定也不可行

数据仓库能够对海量数据进行集成,满足大数据发展对数据存储的需求,为企业提供局部解决方案和全面解决方案

注释:ETL是指从源系统中提取数据,清洗、转换数据为一个标准的格式,并加载数据到目标数据存储区(通常是数据仓库)的工具

来源:艾瑞咨询研究院自主研究及绘制

按照某一特定部门的
决策支持需求而组织
起来的、针对一组主
题的应用系统

面向主题、集成、不可
更新且随时间不断变化
的数据集合,用来支持
管理人员的决策

源应用环境
从属数据集市独立数据集市
Data Warehouse
数据仓库数据集市
Data Mart
数据源ETL数据仓库数据集市终端用户
大数据处理的数据价值流转过程
数据仓库与数据集市工作原理示意
。。。以上简介无排版格式,详细内容请下载查看