Bootstrap

大数据时代的思维变革

拜读了《大数据时代》的第一部分,作者维克托·迈尔-舍恩伯格揭示了大数据所需的

三大思维变革:


1)分析事物相关数据,而不是采样。也可以这么认为,采样=总体。

大数据是指:不用随机化分析法这样的捷径,而采用所有数据的方法。

这里所指的大数据是相对意义而不是绝对意义,不是指该数据量达到了多少多少

数量级,而是你是否对拥有全部的数据进行分析。


2)乐于接受数据的混乱性(包括错误数据),而不是追求精确性。

大数据基础上的简单算法也许会比小数据基础上的复杂算法来的更加有效。

数据库的改变:在关系型数据库中,预先设定记录结构不能满足混乱的大数据记

录,比如错误数据无法被保存在数据库中。需要非关系性数据库来记录这些错误点,

且,非关系性在大数据处理能力上比关系型数据库好,它不用非常精确地保证数据的有

效性和维护同一数据不同库之间的同一性,因为这几乎不会影响大数据分析的结果。


3)关注事物的相关关系,而不是因为关系。

从大数据中分析得出事件A与事件B之间的关系就行了,而没有必要知道两者为什

么会存在这种关系。

相关关系是没有绝对的,它表示的只是某种可能性。

建立在相关关系分析法基础上的预测是大数据的核心

;