新闻中心News
公安大数据解决方案:关于公安大数据的这些,你都知道吗?
浏览数: 发布时间:2019/09/27

近年来,随着公安大情报体系的建设,以及互联网技术的发展,一个以信息爆炸为特征的大数据时代正在到来。各种数据处理的技术层出不穷,这为"数字警务"、"智慧警务"带来了新的手段。对此,公安部门必须以创新的理念和思维,把深入实施科技强警战略,大力推进科技创新摆上更加重要的位置,努力提升公安工作的信息化、科学化和现代化水平。全警采集,内外联动,高度共享,综合应用。

随着大数据技术的普及和应用,"大情报体系"建设需要对数据的大开发,通过使用挖掘算法对海量数据进行分析和建模,挖掘出各类数据背后所蕴含的内在的、必然的因果关系,进而判断出某一事件发生的概率、科学预测其发展趋势,以此来服务打防管控等警务工作。

1.png

一、需求分析

当前公安的业务系统多样,但大多业务系统与实际的业务结合不够紧密,产生了技术与业务"两张皮"的现象,进而信息化难以有效支撑业务的进展,而业务的演变难以对业务系统的进化形成促进,造成信息化与业务脱节。

公安大情报体系建设需要大数据存储技术、管理技术、挖掘技术为契机,能够建立海量的公安数据资源库,不断挖掘公安情报,实现信息化随着业务的发展而快速变化,真正实现业务与信息化的融合,形成业务与信息化互相促进的格局。

(一) 建立大数据采集平台

大数据采集平台大小取决于所获取的数据的广度与深度,所以我们要采集现有的各种数据,公安数据具体可以分为以下几类:一是公安基础工作数据信息。主要包括:人员信息、案件信息、物品信息、线索信息、场所信息等。二是公安内网共享的数据信息。主要包括公安部及各省市公安内网中的在逃人员信息、盗抢汽车信息、违法犯罪人员信息、法轮功信息、通缉令、预警信息、研判指令等。三是外部社会信息。主要包括互联网刊载的违法犯罪信息、商业网站的一些异常信息、保险理赔信息、个人资信信息、中介机构信息、检察机关案件信息、审判机关案件信息、信用卡组织信息、公证机构信息等。

(二) 建立大数据组织平台

大数据采集平台的构建,解决了海量数据的统一存放问题,但是这些来自不同来源的公安数据仍然是散乱的、不规则的原始数据。对原始数据进行清洗、整合,建立规范、统一、完整的基础数据视图。然后在此基础上,针对业务部门提出的具体业务需求,进一步的进行数据的加工和处理,形成面向主题的数据集市,供业务部门使用。

(三) 建立大数据分析平台

大数据分析是公安信息化应用的重要环节,也是情报信息再利用的基础。公安机关对大数据的分析解读是一个去伪存真、去粗取精的过程。分析解读的方法和内容主要是:一是对大数据信息真实性分析。违法犯罪活动大多处于隐蔽状态,所反映信息往往缺乏明朗性,有的甚至具有伪装性,对初期收集到的信息必须甄别其真伪;二是对大数据信息的比对查询分析。这是公安工作特别是侦查工作中运用较为广泛的分析解读手段,通过同类信息比对查询,扩展信息量,串并同类信息;三是量化比较分析。对某个区域、时段、案件、涉案人员、财物、场所以及线索等的数量与前期、上年同期、周边同期进行比较分析等等,例如包括信息查询、人员甄别、串并、碰撞比对,重大案件特点分析预警,各类数据的统计分析、规律提炼及情报收集,可疑人员身份锁定及人员控制,生物信息档案管理和证件鉴别研究等功能。

2.png

二、解决方案

睿帆科技基于对公安系统需求的深刻理,以大数据科学平台Baymax为数据采集处理管理的基础,以NLP中文智慧文本平台为纸质档案结构化的处理引擎,以分布式分析型数据库雪球DB为交互式查询的核心,构建了一整套围绕警务易搜、自助比对、综合查询、信息布控、专题研判、预警分析等多种业务场景的刑侦大数据解决方案。

(一) 大数据科学平台Baymax,为警务人员提供高性能一体化大数据存储分析平台

大数据科学平台Baymax是一款围绕多源异构的海量数据入、存、管、出四个核心场景,集数据集成、数据治理、数据分析、数据监控及系统配置等功能为一体的大数据平台,能有效支撑刑侦过程中各个环节的数据需求,帮助警务人员对海量数据进行采集、存储、治理、分析和挖掘,发现案件中的关键信息。

其支持1000个节点以上的分布式处理,数据处理规模可达PB级别以上,记录文档数据可支持万亿规模以上,支持对结构化数据、非结构化数据,半结构化数据进行统一的存储管理及一体化查询,帮助警务人员快速从身份证、交易日志、卡口视频、案件照片录音等多种数据类型中,快速发现有效信息。

(二)NLP中文智慧文本平台,历史案卷信息读取的小帮手

NLP中文智慧文本平台是一款围绕中文文本的模型自动识别、文本结构化、文本数据应用、关键信息提取四个核心场景,集自动标注、人工标注、模型训练以及API部署等功能为一体的NLP平台,能快速准确处理大量复杂文本,满足不同场景下的文本处理需求,帮助警务人员对大量历史文本案卷进行预处理、存储、识别、提取关键信息和挖掘,发现其中包含的价值。

(三)分布式分析型数据库雪球DB,高效信息交互的核心

分布式分析型数据库雪球DB是一款用于联机分析处理(OLAP)的MPP列式数据库管理系统(DBMS)。提供PB级别大数据集的在线多维查询和分布式存储,特别适用于海量结构化数据存储、高并发点查询、高吞吐即席查询(Ad-hoc)、多维分析和实时查询场景

在刑侦大数据场景中,由于数据量大、查询人员多,所以对于数据库性能的要求极为苛刻。分布式分析型数据库雪球DB在万亿规模数据,进行高并发即席查询可实现秒级响应,这极大的提升了刑侦破案的效率,降低了破案周期。

3.png

公安大数据平台的建设,实现了公安局对各类内部及外部数据资源的系统整合、资源共享、互联互通。通过统一资源服务总线的建立,使大数据平台能够对外提供统一化、标准化、规范化的信息资源服务,业务系统效率获得极大的提升;基于平台建立多种业务分析应用,对多类资源进行关联分析、深度挖掘,建立多种专题研判、预测分析,为公安提供可靠的、全面的实战支撑,为案件侦办、反恐维稳提供有效的数据保障,助力实现“智慧公安”。