目前大数据概念和技术风靡全球,似乎利用大数据,一切问题都可以迎刃而解。
的确,用数据说话,可以纠正我们的一些偏见。比如有人认为读书无用,读好书无用,这在大数据面前不堪一击。网上的各大学毕业生薪金排行榜,几乎就是大学录取分数排行榜。再比如一些人认为日本是一个令人厌烦的国家,可相关旅游数据显示,中国在疫情前大陆去日本的游客基本呈逐年上升趋势,2017年达到735万人次。说明日本对国人还是很有吸引力的。
兵法云:“知此知彼,百战百胜”,说的就是数据信息的重要性。现实世界,各行各业的有关信息铺天盖地,有的数据至关重要,有的微不足道,有的真实,有的虚假。大数据技术的意义不仅在于掌握庞大的数据信息,更在于对这些数据进行专业化处理,去伪存真,去粗取精。
“二战”期间,为加强对战机的防护,英美军方调查了作战幸存飞机的弹痕分布,决定哪里弹痕多就加强哪里。然而统计学家沃德力排众议,指出更应加强弹痕少的部位,因为这些部位受到重创的战机,很难有机会返航。事实证明了沃德的分析完全正确。
上述案例说明了对数据进行完整正确分析的重要性。数据不完整,或者分析思路不正确,可能会得出与事实不完全相符的结论。
比如有数据显示,从改革开放到2017年年底,我国累计超过519万人出国留学,超过313万人选择在完成学业后回国发展,留学归国人数呈逐步上升趋势。这一数据能否说明我国对留学人才的吸引力在不断加大呢?我觉得还不足以证明。这里缺乏的是对优秀留学人才归国比例的统计。随着我国经济的快速发展,很多家庭有实力资助孩子自费出国读书,出国学生的层次千差万别。我1989年读大学时,陆续有一些很优秀的同学通过争取奖学金的方式出国留学,毕业后几乎都留在了国外。只有知道优秀留学生回国的比例,才能正确判断出国内对人才的吸引力大小。
“大数据”并不能取代对于社会问题的理性思考,科学发展的逻辑不能被湮没在海量数据中。更何况为了达到某些目的,还有对数据进行隐瞒,甚至篡改的情况。几十年前,我们的一些“超英赶美”、“亩产过万”的信息报道,使很多人陷入了狂欢的境地。
除了“大数据”,我们更需要有一个颗平淡的心,一颗会思考的头脑。