欢迎来到国脉互联官方网站!

合作电话:010-56873839

仪玛娜 | 政务网站监测服务的差异化竞争——“词库称霸”与“线下为王”

发布日期:2021-11-30T01:30:24.463Z 文章浏览量:
分享到:

关闭

分享到微信

站在新的历史起点和数字化发展创新风口,秉持“智慧报国”的一贯初心,不负连续17年坚持累积的良好社会影响与业界口碑,一年一度的改革研讨盛会“智慧中国年会”,以“聚焦数字化觉醒和数字中国再提速”为主题,于11月24日-25日通过网络直播渠道盛大开启。2021智慧中国年会由智慧中国年会组委会、北京国脉互联信息顾问有限公司主办,设置主论坛和专项分论坛,分别以“加快数字化转型 建设美好数字中国”和“数据治理体系构建与城市运行体征管理”为主题,邀请界内决策者、管理者、建设者、观察者、思考者开展深入探讨、交流与合作。

本文系北京网景盛世技术开发中心副总经理仪玛娜女士于11月25日上午在“2021智慧中国年会”专项分论坛上的演讲。内容通过速记整理,未经本人审核。

 

---以下为演讲内容---

各位老师,各位领导好,我是北京网景盛世技术开发中心的仪玛娜,我今天演讲的课题是政府网站监测新趋势--“全指标实时监测,词库称霸与线下为王”。首先介绍一下我们北京网景盛世技术开发中心,我们公司是2001年成立的,2001年第一个提出为政府网站断链监测服务。2003年第一个为政府网站提供网站24小时值班读网服务,2006年提出政府网站错别字监测服务,2010年第一个为政府网站提供内控监测服务,2012年第一个提出政府网站新媒体影响力服务,2016年提出政府网站运维第三方绩效考核,2019年推出政务网站僵尸栏目实时告警服务,2020年第一个推出网站新媒体黑链实时监测服务。

我们公司20年来只做网站监测服务,连续10年为中国政府网服务,连续15年为首都之窗服务,连续15年为吉林省政府服务,同时承担了全国34个部委网站监测服务和14个省级政府网站监测服务,全国拥有政务政府网站监测服务业务有6000多家,我们公司大概有300个人,这300个人全部从事政府网站第三方监测业务,相对来说比较专业了,我们公司只做这一件事情。

我今天演讲的目录主要有5大项,第一个说政府网站监测服务的新趋势。第二个是监测企业如何降低错敏词漏报。第三网景盛世在降低错敏词漏报方面的优势有什么?第四是监测新趋势-线下定制化服务,讲一下什么叫定制化服务。第五是网景在线下定制化服务方面的优势。

一、政府网站监测服务概述

各类指标全面实时化监测,监测服务从云上数据展示延伸到线下定制服务,符合国办政府网站发展指引的新型监测服务,我们在不断的延伸中。

首先网景盛世是在创新方面真的是首屈一指的,网景盛世是在业内首推僵尸栏目实时告警服务,我们之前只为僵尸栏目提供月报和季度的监测,为了迎合各方面的检测,网景盛世采用创新技术网站全部栏目,不仅是动态栏目,实时每日扫描告警,让客户第一时间知道僵尸栏目的存在,第一时间进行更改更新,避免被相关单位通报。

创新服务方面,我们今年又推出了外链变黑链实时告警服务,针对客户网站上的全部外链做第一时间告警,发现黑链及时处理,把风险降到最低。创新服务应急速度变快了,检测工作中常有客户要求临时紧急扫描某几个关键词,对于之前的扫描网站,我们公司采用了新技术,可做到随时要随时就能报送的程度,第一时间就能达到响应,不用等到新一轮的扫描出来结果再报送了。

我们又新推出了归档服务,实现一档通查,网站故障应急切换至归档页面,网站归档是国办政府网站发展指引的要求,也是国家档案局对政府网站的归档要求。

我举的例子是我们为中央政府门户网站做的一个归档的页面,客户可以在系统上按时间轴回放,看到网站历史某每一天的原貌,可避免网站CMS切换造成的历史数据难以恢复,并实施对历史数据快速检索。应急切换的功能。如何降低错敏的漏报?解决之道在于超大的词库量,错敏词漏报是监测服务中的最大风险。当然了网景也没法避免了,我们错贬词是所有指标中的核心,错敏词与严重搞笑错别字是当下各方关注的焦点,不仅政府关注,包括网信办、新闻媒体、公安、网监系统、纪检监察部门也高度关注并组织力量做监测,从网景盛世的客户反馈中会发现,90%以上的客户高度关注敏感词语,严重搞笑错别字的检测率,并将错敏词漏报作为检测评判、监测服务的唯一指标。

二、避免做免测漏报的关键在于有超大的词库

词库是有怎样的基础建立呢?它不仅仅是语料的训练,算法只是词库的框架,超大词库才是它的基础。为什么说词库是核心?算法的重要性远逊于词库,因为人类大脑各种奇葩的词汇错误方式远非算法能解决的。

首先我们举一些我们常见我们曾经见过的奇葩例子来论证一下我以上的观点。我举的第一个例子是“对党绝对忠诚”写成“对掌绝对忠诚”,这种错误绝对是我们以往的算法无法解决的问题。下面一个例子是,“中华民伟大复兴”写成“中华民族违法复兴”,每一个错误都是够搞笑的了,都是比较严重的政治性错误。接下来这个例子是“人民政府”写成“人民真服”。第4个例子是“定点帮扶单位”写成“定点报复单位”,这都是比较搞笑的。“复产复工”写成妇产科的“妇产”。“不忘初心 牢记使命”,写成“不忘初心 垃圾使命”,还有写成“不忘初心 忘记使命”等等这些错误,都是算法以及原有的词库规则无法检测到的文件,“文件精神”写成“文件请神”,“会议精神”写成“会议请神”,这都是反唯物主义了,只有超大的词库才能降低错名词漏报的风险。只有大型的团队长期耕耘,才能拥有超大的词库。不能否认网景盛世也存在漏报,但我们漏报的风险远远小于非专业的友商,小于成立时间短的业内友商,小于人数少的友商。网景盛世是专职从事词库建设人数有60人,从事错名词建设长达20年,相信专业的力量,相信时间的力量。我们的词库被国内多个权威机构采用,包括国务院办公厅、网信办、公安、网监等领域。

三、政府网站监测服务新趋势——线下定制服务

政府网站监测的核心价值从云上转到线下服务,随着网站与新媒体监测业务的发展,原来仅靠软件平台的客户做客户的模式逐渐落伍,政府客户越来越需要大量的线下人工服务,线下人工服务是为政府客户提供定制化、更细致、使用更方便、更省心的监测数据。政府监测服务的变迁,从线下服务到线到云上服务,再到云上服务与线下服务、线下定制服务相结合的方式。

监测云的线下人工服务举例,某国家部委a要求从对监测报告有特殊格式要求,报告有固定封皮样式,字体之后,月报上描出的所有错误包括主站单独扫描栏目,二级域名,按照错敏词,政治性错误、一般错误,技术检测报告(暗链)4种类型,分类单独形成报告。固定报告封皮,固定字体字号,将问题按不同栏目归类,将文字错误分成多类,这些需求只有靠人工处理才可以达成。客户b有一些历史稿件有的错误不能修改,不能报送,需要人工筛除,客户c要求检测错误的来源是新华网、人民网等网站的信息,要进行颜色标注。客户网站来源那里不全面,有的网站并没有写它的来源单位是哪里,所以需要人工逐条查看核对。上述操作对软件实现十分困难,AI尚未达到如此高的水平,必须有大量人工手动处理。

网景监测云的线下服务举例,客户d在检出问题里需要区分每个单位的信息,不仅仅是文章来源哪个单位,而是主站中栏目归属哪个单位管理,而有些文章又不写明信息来源,需要人工根据内容判定或者根据栏目归属来判定。

客户e一个链接里发现同一个词存在多数错误,可以放在一句话里做概述性描述。比如某某错误在链接共发现几处,点评上述错误让软件实现十分困难。AI尚未能达到如此高的水平,必须有大量的人工进行操作,没有大量的人工团队支撑的网景云是一个空壳子,是一个没有灵魂的服务。线下服务为王的本质是定制化服务为王,只有定制化专有化的服务才是监测服务的未来,在监测业务智能已经普遍云化的当下,谁能提供更多的贴近客户的线下服务,谁将获得更多客户的青睐。

北京网景盛世对线下服务标准的追求目标是做到监测领域的海底捞式服务,网景盛世线下服务的优势一、300多人只从事政务服务网站与新媒体监测。二、人勤,只要客户需要我们去做,不怕活杂。三、人专,服务体系经过20年磨砺,职业化程度高。结论监测服务选择网景盛世的原因,因为投入大,所以错敏词库大,因为大,所以线下服务更多更全。因为专,所以专业研发力量集中,网站问题检测率更高,因为企业时间长,所以词库更大,服务培训体系更完备。

谢谢,以上是我的演讲分享演讲结束。

 

注:获取更多会议资讯及嘉宾演讲资料,欢迎关注以下公众号。

 

 

上一篇:
吴志刚 | “数智用”——让城市治理更精细
2021-11-29T07:04:35.998Z
关注国脉互联公众号获取更多最新资讯
关键热词
  • 营商环境
  • 数据治理
  • 数字政府
  • 2020年会
  • 智慧城市
  • 郑爱军
  • 2020年会
  • 数字政府
  • 数字政府