新疆都市报 > 科技 > 区块链 >

数据治理平台那么多,为什么是它拿下“最佳大

发布时间:2019-05-13 09:45来源: 未知


5月7日至8日,在全国公安工作会议上,习总书记指出,要把大数据作为推动公安工作创新发展的大引擎,全面助推公安工作质量变革、效率变革、动力变革。

人民公安报社总编辑孙福会给绿湾科技颁发证书

在此背景下,5月10日,第二届中国警务信息化推介成果研讨会在北京华尔顿酒店召开。来自全国各地的公安实战骨干、行业技术精英、知名专家学者等齐聚一堂,深入探讨智慧新警务的实战经验。

当前,大数据与人工智能热潮逐渐褪去,新技术能否落地、如何落地成了业内人士最关注的话题。作为数据治理、数据分析挖掘领域的领头羊,绿湾科技因其新一代数据治理平台在数据资产管理、智能化治理、数据分级分类等特点优势在200多个项目方案中脱颖而出,赢得“最佳大数据解决方案”。

绿湾科技数据治理平台产品经理郑彬彬作了题为“用AI驱动数据治理 打牢智慧公安的基石”的主旨演讲。他认为,我们当前处在DT和AI时代的交界处,业务模式已由以前的业务驱动数据,转变为数据驱动业务智能。“谁能做好数据治理,谁就赢得在人工智能的起跑线上。”

1

大数据处理架构演变背后的逻辑

郑彬彬解读最新的公安大数据处理技术规范传统IT架构,系统之间像竖井一样相互孤立,形成了“数据孤岛”。到了DT时代,数据仓库的出现,一定程度上解决了数据孤岛问题,但仍然存在业务单位各自为政,每个部门看到的是局部信息,难以描述全貌。它只是将“数据孤岛”变成了“数据群岛”。为了将“数据群岛”变成“数据统一大陆”,最新的公安大数据处理技术规范将业务与数据分离,要求数据层统一建设、统一管理、统一使用。

换句话说,本次规范是真正从基础架构入手,旨在解决长期以来数据没有打通、数据标准不统一、数据没有开放等深层次的问题。“新一代架构和数仓架构看起来类似,但技术规范对底层技术选型提出更高的诉求,“郑彬彬分享道,”比如要求运用自然语言处理、深度学习等AI技术,系统建设时甲方应要求厂家之间的系统进行兼容,最大限度地发挥每个厂家的AI技术优势。”

2

绿湾新一代数据治理平台有何亮点?

与传统数据治理产品相比,绿湾科技要打造的是一款通用的数据治理引擎,愿景是解决所有行业的数据治理问题。郑彬彬分享道。

他对引擎其中几个特性作了深度分享,包括通用性、智能化、分级分类实战体系及基于机器学习的智能标签等。

对于用户普遍关心的,如何安全、合法、合规地使用数据,郑彬彬表示,绿湾构建了一套完整的数据分级分类实战体系,来规避隐私风险,并将数据安全作为全局考量,纳入所有产品的设计与落地中。“数据治理既要解决用户面临的数据资产不清晰,数据标准不统一,新来的数据如何快速接入并与已有数据进行融合,数据如何安全共享等问题,同时要让数据的获取、融合、提炼、使用、分享变得超级简单。”郑彬彬强调。

3

“公安+AI”赛道上绿湾的自我定位

那么,作为公安大数据应用分析领域标杆性的企业,绿湾科技在公安大数据战略背景下是如何布局的?同时作为一家深深扎根于公安行业的AI新锐企业,它跟其他玩家又有什么差异?

绿湾科技首席运营官秦锋剑在研讨会现场接受了中国警察网记者王婧的视频专访,以下是专访实录:

中国警察网:国内有很多家⼈⼯智能创业公司,都在切⼊公安业务,你认为绿湾做的事有何不同?

秦锋剑:跟大多数人工智能公司相比,我们确实有自己的一些思考和路径:

首先,从出发点来看,我们所有的研发和产品都是基于真实客户需求,我们会深入到基层调研、参与,与客户穿一双鞋子去感受客户的痛点和需求。比如我们跟某市公安局合作,我们会跟一线涉案人员和资深民警去交谈去沟通,结合专家经验和机器智能的优势去训练模型,类案嫌疑预测准确率达到50%以上,也就是绿湾机器学习平台预警自动跳出的100个针对性人员里面,经过确认,超过50个人都命中。

其次,从发展路径来看,我们更注基础工作,就像做一份好的“佳肴”,首先需要好的“食材”。对机器学习来说,我们更注重数据质量、数据完整性、数据关联性以及对数据的深度融合和理解。绿湾在前几年投入了大量的人力在这方面,目前已经形成了数据治理平台、数据融合引擎、机器学习平台等一些列成果。

最后,从发展目标和定位看,我们不是广撒网、大水漫灌,而是选择一个细分市场细分场景做深做透、精准滴灌。比如很多人脸识别公司,在上亿级别的图像库中去识别一张人像时,只能做到70%像谁、80%像谁,而绿湾不会重复去发明这个轮子,而是在此基础上,将人员身份几乎100%的去识别和落地。

中国警察网:绿湾数据治理平台,有哪些独特优势?其中哪些场景会最先落地?

秦锋剑:绿湾在2015年就提出全域大数据中心的理念并推进相关解决方案和产品。与公安大数据战略、新一代公安网和大数据处理规范一脉相承,非常吻合。绿湾数据治理平台的独特优势,主要体现在三个方面:

第一个优势是自动化。面对海量、实时、多源、异构数据,以及数据质量的参差不齐,传统数据治理公司主要依靠人工来解决,人力成本高、低效率,产出质量也不稳定。而我们通过自然语言处理、图像识别、机器学习、本体论等技术,依据行业的数据标准,智能的对数据进行理解、分组、映射、清洗、关联、补全等工作,90%以上的工作可以由机器自动完成。

第二个优势是处理效率。我们采用高效的流式计算引擎,每天清洗数据量可以达到数千亿级。计算到每秒上,也就是嘀嗒一声,300万条数据已经处理完毕。

第三个优势是全程监理。从数据采集、清洗、存储、应用直到销毁,每一个小环节都进行了监控管理、主动报警。就像一个城市的自来水系统,每个环节都安装了传感器,任何一个环节的水质或水量有异常,都会报警并知道问题在哪,并及时处理。

绿湾数据治理平台,目前已经在数十个省市的公安机关和其他政府部门落地。由于绿湾拥有政务数据、警务数据、互联网数据、物联网数据、电信数据等几乎全域数据的处理经验,在接下来的新一代公安网建设中,包括部、省、市级大数据中心建设,会有很多的落地场景。

中国警察网:近年来,绿湾深耕公安领域,逐渐成为解决公安⼤数据业务应⽤痛点的标杆性企业,请谈谈你们在公安⼤数据战略背景下的整体布局?

秦锋剑:可以从产品、技术、市场三个层面分别来看:

产品上,更加重视模块化、平台化和服务化,就像餐厅菜单一样,可以根据客户需求进行组装,并且有足够的开放性和兼容性。

技术上,更重视智能化、自动化,通过机器学习和知识图谱技术的融合,让机器部分具备跟人类似的知识结构和推理能力之后,可以让警务智慧化水平进一步提升。

市场上,我们之前更多的在部级、省级落地,之后会更多的下沉到市县级和基层一线,为基层提供更多实战性的智能应用,更多跨警种的合成作战应用。

中国警察网:当前,公安系统从上到下都在呼唤“数据融合”“数据共享”,您认为,公安系统实现数据融合共享的痛点是什么?绿湾的解决⽅案对于解决数据共享痛点有何裨益?

秦锋剑:“数据孤岛、应用烟囱”问题在每个行业里都大大小小的存在,公安的信息化和数据共享还是走在比较前沿的,但在机制上还有提升的空间。目前来看,新一代公安信息网建设,已经从机制上解决了横向和纵向的共享问题,相对来说,技术层面的挑战又变得比较突出了。

绿湾基于第三代知识图谱的数据治理解决方案,非常适合海量、实时、多源、异构、跨警种数据的深度融合和安全共享。首先是安全共享,绿湾知识图谱支持属性级的“血缘”跟踪和“鉴权”授权,属于最严格的权限控制机制。其次是深度融合共享,什么叫深度融合呢?

举个简单例子,百度能实现全网信息秒级检索,依靠的是超链接,连接的对象是每个网页。公安行业传统大数据产品也是建立连接,连接对象是档案页,而绿湾的第三代知识图谱连接对象是具体的人、地、事、物、组织,通过更细粒度的关联,可以从碎片化的信息中关联出大线索,从而更好的支撑大数据预测预警、精准打击和动态管控,并为建立完整的证据链提供支持。

—END—

(转自: 中国警察网)