在刚刚结束的EMC World 2011上,EMC除了一直倡导的云计算外,还抛出了“大数据”概念,大数据构想是EMC带来的全新理念,想要理解好这个概念首先要从“大”入手,“大” 肯定是指大型数据集,一般在10TB规模左右,但在实际应用中,很多用户把多个数据集放在一起,已经形成了PB级的数据量,而且这些数据来自多种数据源,并以实时、迭代的方式来实现。这种大数据趋势应该是顺势而生,在医疗、地理信息、基因分析、电影娱乐行业都会存在大型数据,而EMC通过Avamar、 Isilon、Greenplum等产品不是简单把数据进行存储,除此之外还需要对数据进行分析,并且与业务流程联系到一起以进行操作。
在本次的EMC World 2011上,EMC针对常用于数据密集型分布式应用的Apache Hadoop开源软件,宣布了一项有关软件发布、集成和支持的全面战略,为客户提供了最强大、最高效率的方法,充分挖掘大数据的价值。这项战略发布,将进一步巩固EMC的领先地位。EMC今天还推出了世界上第一个定制的、高性能的Hadoop专用数据协同处理设备——Greenplum HD数据计算设备(Data Computing Appliance)。