学者名片 刘政,爱尔兰利默里克大学电子与计算机工程博士,IEEE计算机协会高级会员,中国计算机学会大数据专家委员,清华大学大数据硕士项目教育指导委员会主任,中科院深圳先进技术研究院硕士研究生导师,中国软件行业协会理事,北京大学、清华大学、中国科学技术大学客座教授,北京赛仕软件研究开发有限公司总经理。著有《可视化分析与SAS实现》《统计分析实用教程》。
引子:
近日,爱尔兰利默里克大学电子与计算机工程博士,IEEE计算机协会高级会员,中国计算机学会大数据专家委员刘政做客深圳市民文化大讲堂,给市民朋友带来了主题为《新经济与大数据》的演讲。在讲座前,深圳特区报记者采访了刘政老师,他与记者畅聊了大数据给人们生活带来的影响,大数据与新经济的关系,大数据给我们带来的机遇和挑战,大数据与个人隐私保护的平衡,大数据人才需要掌握的核心技能等大家普遍关心的问题。
深圳特区报:新经济与大数据是大家关注的热门话题,什么是新经济?
刘政:新经济是指信息技术革命以及由此带动的以高新科技产业为龙头的经济。我们过去买东西都是到商店里去,现在我们从淘宝上买东西,这是互联网给我们带来的新经济。那大数据给我们带来的新经济是什么?随着大数据的出现,诞生了许多新兴行业。这些新兴的行业就是新经济。物联网、人工智能、金融科技、生命科学,等等。这些建立在数据分析基础之上的新业态也是新经济。
深圳特区报:大数据有哪些特点?
刘政:第一,容量大,非常大的容量。第二,种类多,有各种不同类型的数据,包括视频的数据,图片的数据,语音的数据,文本的数据,还有各种其他形式的数据,它的数据形式是多种多样的。第三,它的增长速度非常快,每天上亿人在使用手机上网,就会产生非常多的数据。这些数据中有很多有价值的东西,我们可以去挖掘。
深圳特区报:大数据的数据分析方式和传统数据分析方式有何不同?
刘政:在大数据出现之前,我们运用传统的数据分析方式,例如统计分析、运筹学、计量经济学来做数据分析,这些数据分析方式只能处理比较小、比较短的字节,处理的数据范围也十分有限。大数据出现之后我们可以处理一些过去处理不了的数据,比如大数据可以进行文本分析,它可以从用户对某一产品的评价反馈中分析出用户对该产品的情感取向,我们可以第一时间了解到产品的哪些方面是用户喜欢的,哪些方面是用户不喜欢的,从而改善产品的功能与设计。除了文本分析,大数据还能进行图片分析,包括现在很火的人脸识别,这些都是传统数据分析无法完成的。
深圳特区报:大数据的数据分析方式,会替代或者颠覆传统的数据分析方式吗?
刘政:它不是一种替代,应该说是一种补充。其实有时候新的方法不一定比传统方法好。比如说我们给这个银行做模型的时候,我们可以用统计分析的方法去做,也可以用机器学习的方法去做,然后你比较两个结果,会发现相差不多,但是统计分析结果的过程更简单,速度也更快。
深圳特区报:政府、企业怎样才能利用好大数据?
刘政:政府可以利用大数据技术推动公共安全治理,我国传统犯罪预防主要以已发生的案件类型作为预防对象,常常忽视事前对犯罪相关因素的调查或跟踪,预防效果并不明显。而大数据可以分析各级各类政府部门在社会治理中积累的数以亿计的公共服务大数据,比如出行记录、犯罪记录、法院记录,等等,公安机关可以根据数据分析的结果更快地锁定犯罪嫌疑人。
另外大数据在社保体系的建立中也起着至关重要的作用。通过数据分析,我们可以提高社保的针对性和有效性,从而帮助更多人解决问题。另外,大数据可以对重复领取待遇、死亡冒领养老金、违规提前退休等问题进行有效监管,筛查社保基金欺诈违法行为,提高基金安全监管的针对性和精确性。其他还包括智慧交通、国家人口统计,等等。有了大数据的加持政府的决策会更加高效、更加科学。
对于企业来讲,金融行业应用大数据是最多的。大数据能帮助企业提高工作效率,提高决策的精准度。企业能不能利用好大数据,关键是看企业决策者的重视程度。
深圳特区报:在大数据概念随处可见的当下,作为个人,我们应该如何提高“数”商以适应大数据时代?
刘政:在现在这个时代,其实我们每个人跟数据都脱不开关系了。数据现在就相当于生产资料,它是可以买卖的。商家掌握了你的数据后就可以根据你的喜好不断地给你推销产品;电话号码泄露后会有许多的骚扰电话。于是如何保护个人隐私?个人隐私数据的所有权,如何去界定?我们也应该主动去了解。
深圳特区报:大数据是否在改变着我们看待世界的角度和思考生活的方式?
刘政:可以这么说,过去我们做决策不会考虑数据的因素,现在我们可能会更多的要去考虑用数据做分析,参考数据分析的结果,来评估风险,大数据的确会对我们的思维决策过程产生影响。
深圳特区报:如何理解大数据是一把双刃剑?
刘政:其实很多技术都是双刃剑,就是说既对人有帮助也对人有伤害,大数据也是一样,关键看你怎么用。企业用大数据可以挖掘出很多有价值的东西,但也有人会用大数据去做一些坏事。大数据现在很大的一个缺失就是在立法上。比如说数据的所有权问题,数据隐私保护问题,数据交易问题,数据分析的结果在法院能不能作为证据来使用等问题都需要立法来明确。但是因为大数据是一个以前从未有过的概念,在立法上也没有可以参考的东西,所以会有一些无从下手。我认为,应该先草拟一个版本,通过模拟的方式对其进行修正和补充,等待它成熟之后再正式颁布。
深圳特区报:大数据人才需要掌握的核心技能是什么?您对大数据人才培养有哪些建议?
刘政:大数据人才要掌握的核心技能就是数学。在计算机时代,美国企业找人,就首选数学专业,到今天大数据时代,还是首先选学数学的人才。学数学的人思维能力强,容易理解各种算法和数学模型,加上计算机编程能力,可以写出高深的程序。所以,我们的高等院校一定要加强数学教育。其次,要掌握的技能包括计算机、网络技术、编程、行业知识等。在人才培养方面,大部分学校都还缺少合格的师资,缺少教案。我觉得弱校应该多向强校取经,交换资源,向社会开放引入资源。我们现在就在做大数据方面的教案,还有SAS免费捐赠的软件,希望能帮助一些高校做好大数据人才培养。
深圳特区报:前一段时间,换脸软件Zao一夜爆红随即遭遇滑铁卢,大数据和个人隐私又成为了舆论的焦点,您如何看待?
刘政:新产品的上市销售都经过国家的审批过程,软件产品是否也应该经过审批才可以上市?如果不是这样,就难免会出现鱼龙混杂,违反法律和伦理道德的问题。Zao获取私人数据,让用户未经许可擅自修改别人的照片、侵犯他人权利,滥用技术给当事人造成名誉损害和精神伤害,甚至包括经济损失,理应受到惩罚。
深圳特区报:有人曾经发表过:“中国人愿意用隐私换取便利”的言论,您如何看待?
刘政:数据的概念,个人数据隐私对大部分中国人来说,还都是一个比较新颖的概念,对其缺乏充分的认识。我觉得不能说是“中国人愿意用隐私换取便利”,而是大部分人对此没有清楚的认知,不知道其危害性。如果商家利用人们的无知和善良获取、甚至骗取私人数据,就太不善良了。当人们明白过来的时候,就会向商家讨公道。商家做生意一定不要短视,看重眼前利益。前面应该是都吃过教训的。国家应该尽快进入立法程序,在大数据时代保护人们的合法权益和商家的正当权益。
(本文源自对深圳市委宣传部和深圳市社会科学联合会主办的深圳市民文化大讲堂第1158期嘉宾的采访)