原来《易经》里的64卦就是人类对数据的利用、分析和运用。
数据并不是单纯的指数字,在如今这个时代,互联网上的任何内容,比如文字、图片和视频都是数据;公司的设计图;出土文物的图示、文字;宇宙的形成过程中留下的任何内容等等,这些也都是数据。
同时人们在谈论数据时经常会存在另一种错误认识:将数据与信息混为一谈。然而数据和信息有时是不同的。数据的最大作用在于承载信息,通过数据分析出来的才是信息。
在90年代之后,互联网逐渐兴起,因此数据的取得变得非常容易,可利用的数据量剧增,世界各领域的数据不断向外扩展,慢慢形成了其他的特征。很多数据开始交叉,各种维度的数据从点和线渐渐连接到了网。或者,数据之间的关联性非常强。在这样的背景下,大数据便出现了。
大数据最明显的特征就是体量大,但同时还要满足一定的现实意义。
2013年9月,百度公司公布了一个有趣的排行版——《中国十大“吃货”省市排行榜》。那么,百度是做了很多研究和民意调查吗?其实,并不是。百度公司只是利用“百度知道”的7700万条与吃有关的问题挖掘出了一些结论。比起那些晦涩的学术研究,这份排行榜显得要接地气且真实得多。
虽然上面的这些数据使用传统的方式也可以得到,但是相比于使用计算机来说成本太高,并且难度大。要知道百度的这些数据并没有刻意去收集。
大数据最后一个特征也是最容易被人们所忽视的一个特征,即全面性,或者说完备性。
在中国的远古传说中,有伏羲演八卦的故事。伏羲是中国上古的三皇之一。据说他发明了八卦,并且可以通过它推演未来的吉凶。
所以纵观人类发展的历史,数据的作用自古有之,可以说数据是人类文明的基石。