大数据条件下的企业数据共享问题
面对海量数据,信息孤岛问题成为企业实现大数据的桎梏,企业在此条件下应如何选择合适的数据共享实现方式,对于企业实现大数据具有重要意义。
目前,大数据成为时下热门的词汇和趋势,各大企业将大数据视为自己实现竞争力的有力武器,其原因是大数据能够运用数据挖掘技术,实现海量数据的综合分析处理,以快速的发现商机和企业内外部情报,实现管理的智能决策。
企业实现大数据的前提是信息资源共享,但目前企业中普遍存在的现象是各类系统林立,不同的信息标准,将企业陷入在一个个信息孤岛中,无法对海量数据进行综合利用,由此成为企业实现大数据的桎梏。因此,解决信息孤岛问题,实现数据共享成为企业实现大数据首先要解决的问题。但是,在大数据条件下,企业中的数据量,数据结构均发生较大变化,传统的数据共享方式是否仍适合于企业,到底应该采取何种方式实现数据共享才是大数据条件下的最佳选择?
大数据条件下,企业数据呈现出新的特性,面对这些新的特性,传统数据共享实现方式的适用性怎样,企业究竟应该如何选择数据共享实现方式。大数据的 4V 特性为:
其一,Volumn,数据量大,目前,一些大型企业的数据量已接近 EB 级别;
其二,Va-riety,数据类型多,大数据条件下,企业的数据不仅有结构化数据,还有视频、音频、图片等多种类型的非结构化数据;
其三,Value,数据价值密度低,随着数据量的不断增加,数据出错的概率提高,数据不真实的比率也在不断提高,因此,数据的价值密度降低;
其四,Ve-locity,数据处理速度高,数据量的增加,要求计算机具有海量数据的较快处理速度。
根据大数据的 4V 特性,企业数据呈现以下几方面的特点:
a.信息系统繁多,系统功能基本覆盖企业业务,新建系统需求不多。随着信息系统的不断发展,大型企业不断建立各种业务功能的信息系统,如: 财务系统、供应系统、人事系统、绩效管理系统、生产调度系统以及各类监测监控系统,因此,企业对新建单一系统的需求并不是很高。
b.系统中存储的数据量大,数据质量不高。大数据条件下,大型企业信息系统中的数据量与日俱增,但在海量数据中,到底哪些数据是真实无误的,哪些是没有价值的,很难区分,致使系统中的数据质量严重下降。
c.各类系统数据异构复杂,多种数据标准同时存在。企业种类繁多的信息系统中各有各的标准,致使系统中同时存在多种数据标准,形成了一个个的信息孤岛。
d.系统中的数据类型多样。大数据条件下,企业的数据类型出现了结构化数据和非结构化数据。
下一篇:如何确保您的数据交换安全