有人说,大数据就像20世纪的石油那样,是一种战略资源。但20世纪之前的历史长河中,石油根本不是战略资源,甚至连一般性的资源也算不上。改变石油命运的,是100多年前内燃机的发明。
走进“第四个”大数据时代
现在所说的大数据,都是指“数字化”的信息。如果把“数据巨大”、“类型繁多”、“单位价值下降”和“处理及时”的非数字化的信息也认为是大数据,就会发现在人类历史上已经多次经历过 “大数据”时代,而且每一次“大数据”时代,都导致人类社会的巨大变革。
第一次是语言的发明。语言可以让思想交流融合,让分工合作成为可能。但随着“语言大数据”的发展和应用,语言作为唯一载体的缺点开始显现。第一,地理范围有限,经常仅在部落内传递;第二,对象范围有限;第三,信息容易失真;第四,信息容易失传。于是,弥补“语言大数据”缺陷的新信息技术--“文字大数据”时代开始出现和繁荣。
相对语言,无论是图形文字、声音文字还是数学符号,可以承载的信息量和信息类型更多,传播范围可以更广、更加准确和更加便于传承。有了文字,无法长久保存和必须同步传播的口头信息,变成了“永久性”、可异步存储的符号记录。
文字(包括数学符号)的产生和传播,使生产力又一次得到了飞跃,并且催生了历法、兵法、法律和礼仪等,加速了贸易的发展,人类又一次被淹没在了“大数据”的洪流中。文字是“大数据”的载体,但文字的载体是乌龟壳、羊皮和竹简,以及后来发明的纸张等,相对仍然比较昂贵。另外,这些类型的书籍需要靠人工抄写或雕刻,费时费力而且常会出现错误,因此书籍仍然难以平民化,“文字大数据”传播的范围仍然很有限。
于是让信息可以用“工业化”的方式存储和传播的印刷术出现了。印刷术结束了手稿时代,让文化广为传播,再次扩充了信息的数量和组织,“大数据”时代又一次来临。印刷术导致书籍和知识“泛滥”,直接引发了人类社会的巨大变革。
随着工业革命的推进,产生了更大量和更多类型的数据处理需求,导致了信息采集、保存和处理作为独立的一个行业--“信息产业”的出现和繁荣。电力革命后,整个社会经济活动的重点,从材料的使用转移到了对“大数据”的使用,企业也在纷纷取消内部动力生产部门的同时增加了信息处理部门。而近年来随着智能手机、平板电脑、个人电脑、数码相机、数字摄像机、POS机以及各种各样的传感器等终端逐步接入互联网,气候、天文、地质、生物、基因、军事、商业和医疗等行业数据的普遍数字化和网络化,以及博客、播客、微博、社会化网络等的爆发式增长,数据越来越“大”,人类又一次遭遇了“大数据”时代。与此同时,随着移动互联网和社交网络的飞速发展,单位信息的价值快速下降,人类被淹没在了“信息垃圾”之中。
这次的大数据时代中,信息的产生、传递和保存不仅“工业化”了,而且“数字化”和“自动化”了,人类社会发展的核心驱动力,也从之前的“动力驱动”转变为“数据驱动”。垃圾是放错地方的宝物,因此必须诞生革命性的技术手段,将这个时代的“信息垃圾”换一个地方,换一种方式提供给我们。
历史上的每次“大数据”时代,对人类社会的影响都是革命性的,这次也必将会是颠覆性的。
云计算是大数据的“内燃机”