在很多人的印象中,数据就是数字,或者必须由数字构成。其实不然,数据的范畴要比数字大得多。它包括文字、图片、视频、医学影像等。同样,信息和数据也不能简单地混同起来,信息是关于世界、人和事的描述,它比数据抽象。比如,通过测量星球的位置和对应的时间,就得到数据;通过这些数据得到星球运动的轨迹,就是信息;通过信息总结出开普勒三大定律就是知识。实际上,把隐藏在无垠世界的信息找出来,并用数据描述清楚,再通过这些信息形成有用的知识,是推动人类社会不断进步的重要动力。
在历史的长河中,因没有数据支撑而“抱憾”甚至为此丢掉性命的事没少发生。众所周知,哥白尼假设并提出“日心说”,却没有得到世人认可,甚至布鲁诺为支持“日心说”被活活烧死在罗马鲜花广场。最重要的原因就是哥白尼缺乏数据,不能“以数服人”,还被教会诬称为“异端”。而完成这一使命的是约翰内斯·开普勒,开普勒在所有一流的天文学家中,资质并非最优,但他从老师第谷手中继承了大量的、在当时最精确的观测数据。通过计算研究,提出三大定律,完成了从量变到质变的过程。
数据历来被兵家所用,可谓“数中有术,术中有数”。从古至今,不乏善用数据的兵家和良将。《孙子兵法》中讲到的五条原则:“一曰度,二曰量,三曰数,四曰称,五曰胜。”其中,“度”是指国土的大小,“量”是指粮草资源的多少,“数”是指军队的数量,“称”是指双方实力的对比。可以看出,战争的胜负就隐藏在这些数据之中。1947年5月,我军在山东蒙阴县东南地区发起孟良崮战役。战争结束收拢部队、清点战果时,我电台发现孟良崮地区仍有敌人电台活动。指挥员粟裕立即严令各部清查毙伤俘敌实数,发现“所报歼敌数与敌第74师编制数相差甚大”,立即命令部队继续进行战场搜索。此时,敌确实还有近7000人隐藏在孟良崮、雕窝之间的山谷中,由于我军及时精准地进行围剿,致敌来不及集结,最后被全部歼灭。粟裕在事后总结经验时指出,“各部均能如实报告歼敌实数,不事浮夸,才得以发现这股残敌。”
兵无常势,水无常形。未来作战,由于信息化装备的广泛运用,武器的杀伤力破坏力骤增,作战节奏加快,指挥控制复杂,战场更加残酷、激烈。对指挥、参谋人员和一线作战人员的心理素质、适应能力、决策水平等都提出更高要求。比如建什么样的数据、怎么建数据,如何把有用的信息和资源数据化,如何确保平战一体的数据库安全使用,如何采用智能化手段利用这些大量、多样和及时的数据信息,等等。千万不能简单地将大规模数据和大数据混为一谈,认为搞一些传统统计方法就可以找到大数据规律。计算机之所以能在一些方面超过人类,是因为机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠大数据和智能算法。
信息爆炸的社会,也是信息极度渴求的社会;获得知识最方便的时候,也是最容易丢掉真知的时候。搞信息化建设和联合作战问题研究,是一个把战争思维变数据信息,把万变的战争穷举成“固定模式”的巨大工程,更是需要付诸“智力”和“计算力”无数次挫折的过程,不能一蹴而就。贝文·亚历山大在《统帅决胜之道》中有句话说得非常好:“对高明将帅如何决胜的理解,是从认识到平庸的将帅何以不胜开始的。”对于研究大数据而言,把不胜的数据研究透,或许就能找到大数据的制胜之道。
(作者单位:32137部队)