欢迎来到国脉互联官方网站!

合作电话:010-56873839

赖茂生:数据体系构建的方法论与实践

发布日期:2020-11-26T12:47:19.619Z 文章浏览量:

2020年会

数字体系

分享到:

关闭

分享到微信

2020年11月26-27日,由智慧中国年会组委会、北京国脉互联信息顾问有限公司联合主办,国脉研究院承办的年度改革创新研讨盛会(第16年)——“2020智慧中国年会”在北京隆重召开,以“十四五前瞻与智治社会建设”为主题,来自全国部委、省、市、区县电子政务、智慧城市、大数据等领域的主管领导、行业专家、企业代表、主流媒体等齐聚一堂。

本文系国家信息资源管理北京研究基地主任、北京大学教授赖茂生先生于11月26日下午在“2020智慧中国年会”主论坛上的演讲。

 

我们现在面临的到处都是数据,已被数据包围,可以说现在是数据的世界。在这样的数据世界里面,我们怎么样来认识它?现在我们可能还处在“只缘身在此山中”的一个状态,但是要管好数据,用好数据,能够很好地认识这个数据世界,是一个人人都应该考虑的问题。

下面我把我学习的一点体会跟大家汇报一下,主要有三个方面,一是对数据世界的认知;二是数据世界的到来,人类面临的重大挑战;三是我们需要做什么。

一、对数据世界的认知

(一)数据是什么

对于数据世界我们怎么样来认识它,首先大家需要了解的是数据到底是什么?概括地讲数据就是我们人类的感官(及其延伸)感知到的物体或物质的各种现象(声、光、电、磁、色、味等)及其特性的表示。有些现象可以通过眼睛、耳朵或其他感官直接感知到,有些需要通过一些技术、仪器设备才能感受到,有些由于现有技术和工具的局限性还感受不到,但实际上它是存在的。

我们感知到的东西,通过采样和量化,就成为了数据,再通过(二进制)编码,就成为机器可读数据。数据跟信息的关系,一般来说信息是对数据进行处理和再表示的结果,但有时候这两个词又是可以通用的,有些可以直接看的数据就是信息。对数据的认识,我们不能仅仅局限于直观上的表示,更要看到它对于社会、组织和个人意味着什么。

数据是我们认识世界的初始信息,更重要的是它是当代社会的重要资源。数据也是一个组织的重要资产,我们现在做的很多事情,包括抗疫、创新、为群众服务、创业等等,几乎都离不开数据,一个组织要很好地运作下去,提供服务、产品,没有数据是很难办的。

数据还是一种制度性力量,数据虽然会受到制度的影响、制约,但是它反过来也会影响制度,成为一种制度性的力量,这种制度性的力量会作用于我们的政治、经济、军事、文化等方面。数据又是组织新的价值来源,同时也是最大的风险来源。数据管理不佳,通常会导致决策效果不佳,甚至是面临违规和财富损失的风险。

(二)数据世界的图景

这个图把我们现实世界抽象分成这样几个层次:现实世界、机器世界、信息世界、数据世界。数据被包含在信息世界、机器世界和现实世界里。

数据具有分层的结构特征,这是一个作为数据存储中心,来显示数据层级结构的例子。

(三)数据世界与自然界和人类社会的关系

数据世界与自然界和人类社会的关系,主要表现在这样几个方面:一是自然界和人类社会的一种反映;二是数据是人类活动的产物;三是人类认识自然和认识社会的材料和工具;四是具有相对的独立性,离开它的生产者和创建者之后,数据具有相对的独立性;五是受人类的支配,这种支配的程度也是不同的,如果治理方面的工作做得好,技术和工具比较先进,那么就会是比较完美的支配。反之,人类对它的支配力量就会很有限。

这个表展示的是数据在不同应用领域里的一些类别,包括电子商务、电子政务、科学技术、医疗保健、公共安全,每种应用涉及到的数据类型和特征,以及所需要的数据分析类型和效果也在这里展示了。这方面的内容还在不断地丰富,不断地发展。从这个表我们可以看出,我们已经做的事情是很多的,但是还有很多事情还要做,还在做。

二、人类面临的重大挑战

(一)认识能力方面的挑战

一是数据的特性和本质到底是什么?以前讲大数据人们通常会讲“4V”四大特征,那么数据的本质到底是什么?它是一种客观反映,是人类共同创造的人工物品,它跟信息、知识有不同的地方,特别是知识,有非常明显的创作者、责任者,也就是说它可以根据这个来确定我的权益是什么。但是数据,因为是大家共同创造的,就涉及到很多新的问题,特别是所有权的问题,以及其他相关的权益问题、管理问题和传播问题。

二是数据世界里的行为及其规律。我们知道在信息社会里,至少有三大定律是大家比较熟悉的:摩尔定律、吉尔德定律、麦特卡夫定律。那么在数据世界里,它的规律是什么?有没有?有哪些规律?在结构上,我刚才提到了层次性,结构的层次性是一种规律。那运动方面有什么规律呢?第一个是数据有生命周期,从它的产生创建,一直到最后被处理,是有一个生命周期的,在不同的阶段,它的性质、形态、价值可能是不一样的。第二个是在数据世界里,人们认为有模式定律。数据当中总是包含有各种各样的模式,这个模式需要我们去发现,这就是模式定律。第三个是变化定律,所有的模式都会根据业务的变化而变化,而不是一成不变。第四个是价值定律,数据分析结果的价值不主要取决于模式的精准和稳定,而主要取决于业务意义或有没有合适的业务应用。我们讲大数据治理和管理,实际上就需要跟各种各样、各行各业的业务密切联系起来,离开了业务,数据的价值无从谈起。

(二)制度方面的挑战

第一个是数据公平问题,数据公平包括国际上的数据公平,以及在一个国家、地区内部数据公平的问题,这些问题都是比较普遍的。第二个是双重规则下的竞争问题,管理数据的应用方面,面临着双重规则竞争,这种双重主要指的是国内或者国外,市场或者政府具有不同的制度。第三个是数据权益问题,我们在这方面要确立比较合理、完善的制度还需要做很多工作,还有很长的路要走,因为数据的创造者是不一样的。

(三)安全方面的挑战

国家安全问题,像国际上的“棱镜”项目,对世界各国具有很大的威胁,同时也涉及到我们国家所掌控的数据资源,数据资产主权怎么去保卫、维护的问题。组织和企业也面临着各种各样的安全问题,数据里面有价值,就越容易引来更多的风险和攻击者。还有个人也面临着隐私保护问题等安全问题。

(四)技术方面的挑战

技术方面的挑战大家在数据管理、数据应用第一线更有体会,我个人认为技术方面的挑战主要是业务需求在不断地增长,而我们现有的技术、软件跟数据处理能力有的还不能适应业务需求。信息安全方面的挑战也是非常明显的,我们有关部门每个月都要公布很多网络攻击等网络事件。还有我们相关的技术对国外的依赖和面临国外封锁问题,以及技术运维等挑战。

(五)人才方面的挑战

人才方面大家可能更有体会,因为这是一个数据人才奇缺的时期,数据应用、数据管理都在普遍地开展,但是这方面的专业人才非常的紧缺,包括数据科学家、数据治理专家、首席数据官、数据管理师、数据工程师、数据分析师等等。现在我们在教育和培训方面还远远跟不上社会的需要,要培养出真正合格、适应社会需求的人才,并不能一蹴而就,所以这方面的任务是非常艰巨的,光靠高校是不行的,这方面的培养任务我们各个部门、各个单位都需要下功夫,做好自己这方面的工作。

三、我们需要做什么

(一)认识层面

在认识层面我们要继续深入认识数据世界的复杂现象和本质,认识数据世界的运行规律和规则,认识人类对数据世界的真正关切是什么,包括大数据资源给我们带来的机遇和挑战是什么,还有就是认识其中的国家利益是什么,认识人类面临的挑战是什么。

(二)国家制度层面

在治理制度方面,相关法律法规的完善还有很多工作要做。

(三)组织层面

在组织层面,需要做好的就是治理架构、应用基础、组织体系、组织文化、人才队伍这些方面的建设。在数据应用基础方面,一个组织要对数据资源能很好地应用,没有这些基础工作,我想也很难做得很好,所以在这强调六个方面:用户需求、数据来源、元数据及其标准化、数据质量、应用环境条件(流程、技术、方法、工具等)、应用场景、应用效果评价。

注:获取更多会议资讯及嘉宾演讲资料,欢迎关注微信公众号“国脉研究院”(微信号:ethinktank)或“2020智慧中国年会官网”(网址:http://www.govmade.cn/thematicActivities/index.html)。

国脉研究院

下一篇:
金鸣:“绩效通”——赋能数据治理
2020-11-28T08:15:33.683Z
关注国脉互联公众号获取更多最新资讯
关键热词
  • 营商环境
  • 数据治理
  • 数字政府
  • 2020年会
  • 智慧城市
  • 郑爱军
  • 2020年会
  • 数字政府
  • 数字政府