锁定罪犯大数据是“法宝”
记者/韩继波
大数据的作用越来越强大,就连破案也离不开它。
不仅移动支付、聊天记录可以用来锁定嫌疑人,甚至遮挡号牌、脸部伪装在大数据面前也被“秒杀”。
▲以大数据中交通、住宿、通讯、社会关系等方面信息为支撑,通过信息不断碰撞、对比、辨析,就可以精确锁定违法犯罪嫌疑人
采访专家
王元卓(中国科学院计算技术研究所教授)
宋怀明(曙光信息产业股份有限公司大数据研发总工程师)
据中新社报道,2月7日,国内第一个大数据发展管理局在贵州成立,这也是目前中国唯一一家省政府直属的正厅级大数据行业管理部门。
说起大数据的用处,大家能马上想到的也许就是天气预报、淘宝和京东的统计等等。其实,破案也是大数据的“拿手好戏”。过去破案,民警大范围走访,进行摸底排查工作是必须要做的。可如今,好多你听都没听过的办法正被用来准确锁定罪犯。比如,特定区域通讯信息筛选法、内外网搜索寻踪法、视频追踪法、网络特情定位法……
这么多“法”,说到底,背后都是同一种技术在做支撑,那就是——大数据!
理解不了?那还是借用马云曾经打的一个比方做个“白话版”的解释吧:以前抓小偷是靠反扒民警一天天不断地巡逻,同时依靠经验,比如看眼神、看举止、看步态等方法,从人群中“发现”嫌疑人。但是如果有了大数据技术的支撑,警察就不用天天在公交车和商场里耗时间了。如果嫌疑人使用了电子支付,警察通过大数据的分析,发现某个人一天之内坐了 50 辆不同的公交车转来转去,那这个人就可能很可疑。
交易记录监测防范电信诈骗
大数据真的有这么神?对于这个问题,主要研究网络大数据分析、社交演化行为分析、隐私泄露行为分析的中国科学院计算技术研究所王元卓教授,给出了相当肯定的答案。他认为,大数据不仅可以帮助警方破案,而且今后在刑侦领域的应用前景非常广泛。
过去刑侦人员办案,主要依赖拉网式摸底排查、满世界追捕、长时间高强度审讯这些传统办法。再高级别一点的侦办是依靠视频系统,追踪案发现场的某个可疑人员或物品出现的不同时间、地点,以及持有物品的人的体形、着装、面目特征,通过整个视频监控网络,找到重要线索。
现在最高水平的侦办方法是以大数据中交通、住宿、通讯、社会关系等方面信息为支撑,通过信息不断碰撞、对比、辨析,发现违法犯罪活动规律特点,精确锁定违法犯罪嫌疑人,实现网上排查、网上串并、网上追踪,减少了破案成本,提高了破案效率。
曙光信息产业股份有限公司大数据研发总工程师宋怀明则进一步解释说,大数据的“破案”优势,在金融、电信诈骗案件上表现得尤为突出。警方主要基于大数据的分析,对异常行为进行监测,包括交易额度、交易频度、交易网络结构、交易时间、交易地点、特定账号等多个维度的特征。发现可疑的交易行为后,则有针对性地实施特定的保护措施,比如监视、追踪、阻断、冻结等,并通过多重认证的方式确认交易的合法性。所以,大数据完全可以锁定电信诈骗嫌疑人的关键信息。
海量聊天信息中定位刑案疑犯
除了预防和阻止电信诈骗案件的发生,在刑事案件中,对于“找人”,也是大数据的“强项”。
王元卓介绍,对社交网络数据的聊天语义分析,是目前大数据助力刑侦人员破案的先进手段之一。大多数人都清楚社交网络中有海量的聊天信息,这些信息中蕴含了大量敏感内容。过去针对信息的查询只是针对关键词匹配进行的检索,没有根据语境和上下文关系来判断聊天的信息是否与非法案件有关。采用大数据的聊天语境智能分析能够自动地对聊天内容进行上下文的语境分析,能够较为精确地对敏感人物的敏感信息及聊天内容做定位。
警方还可以通过嫌疑人互联网的网名、IP地址等网络痕迹,进行行为模式、好友关系、语言特征的分析,确认他的虚拟身份、具体特征。然后,再通过虚拟身份和现实身份进行映射分析,就可以确认嫌疑人姓名、性别、爱好等特征,掌握嫌疑人的数据档案后,便可以在网络、现实两个空间里找出特定嫌疑人的具体信息,比如常用电话、活跃的地理位置、社交关系。
王元卓举了一个真实案例,警方大力追查的嫌疑人具备一定的反侦查能力,但是上网成瘾,每次在异地他乡上网聊天时间都很短,警方多次抓捕都未成功。刑侦人员使用社交网络数据聊天分析和虚拟身份与真实身份映射分析的方法,准确地确定了嫌疑人的监控数据、上网聊天信息、好友信息以及出现地点和时间。嫌犯被抓时根本不相信警方的速度。
▲太原火车南站广场应急反恐演练现场,公安民警和武警制服“暴恐分子”
遮挡号牌没用,车标轮胎都能锁定嫌疑车辆
有资料显示,虽然遍布国内各城市的监控摄像头采集了大量的车辆图像信息,但老旧的视频监控系统只能识别车牌、颜色、时间、空间等几个维度的简单信息,并不能识别车标、车型、年份等关键信息。换句话说,过去的车辆识别系统,只具备搜集、比对图片的初步能力。而通过使用先进技术,可以改造提升低分辨率、老旧视频监控系统的能力。
王元卓介绍,图像识别和处理技术精度越来越高,大数据深度学习的能力越来越强,智能芯片技术的提高,这三项逐步成熟的先进技术,将终结车辆号牌遮挡违法行为。大数据对大角度、强干扰下的车辆可识别能力越来越强了。即使遮挡了号牌,警方也可以根据车标、车体细小差别、内饰、轮胎、出现轨迹等信息,进行高准确度检索、识别。因为大数据弥补了人工智能的缺陷,学习的精度越来越高,会让智能算法的适应性和准确率都很高。
《人民公安》杂志曾经报道,山东寿光已投入使用的“神眼大数据系统”,采用治安卡口、室外WiFi、其他电磁轨迹信息采集设备同步规划和叠加建设的方式,可以同步采集车辆的图片和电磁数据,根据采集到的图片和电磁数据,可以做到“以图查车”,能够分分钟锁定涉案车辆。这个系统解决了传统视频侦查依靠人工筛选费时、费力的难题。
▲ 在侦破一起刑事案件过程中,湖北武汉博康治安卡口在案发当晚9 点40 分嫌疑车辆经过东新公路红庙京珠桥下时拍摄到的画面。此车无牌照、夜间使用遮阳板
脸部伪装徒劳,大数据+人工智能还原真实面目
最蠢的劫匪都知道用戴眼镜、戴帽子、戴面罩等方式遮挡自己的脸。再加上警方一般不掌握初次作案嫌疑人正面、高质量的脸部图像信息。以往的排查难度非常高,强度非常大,全靠刑侦人员的主观判断,效率非常低。王元卓告诉北京科技报记者,人脸识别计算量非常大,十多年前一张高清人脸图像采用神经网络方法分析可能需要计算数十天,那时数据使用效率是很低的。
而现在,刑侦人员在侦办这类案件时,只要获取了伪装后嫌疑人足够多、各角度、多维度、高质量的图像,就可以使用融合人工智能技术的大数据,还原嫌疑人面部特征。
▲2015 年, 全国有89% 的网民遇到过诈骗信息,总人数高达4.38 亿
王元卓表示,由于深度学习技术的发展,对人的生物特征的识别已经不是简单的人脸识别了,包括对伪装后的嘴唇、鼻子、耳朵轮廓等图像,以及嫌疑人的步态等都可以在较短的时间内获得较高的识别准确率。
如果这些生物特征识别技术无法协助警方抓获嫌疑人,警方还可以将此人在视频数据中的大数据进行关联,划定他的活动区域、日常联系人,这些大数据也同样是破案的重要信息。
假如案发现场留下了嫌犯作案的工具,或者视频资料拍摄到了嫌犯穿戴的衣帽,或者其他证物,警方可以对证物进行大数据分析,进一步排除、圈定与证物有关的高价值视频资料。
▲武汉火车站西广场应急反恐演练现场,警务人员应对“暴恐分子”
时空轨迹分析,预警恐怖行为
目前,国际上通用的预防反恐手段是,通过分析恐怖分子日常产生的各种信息,如通话、交通、购物、交友、电子邮件、聊天记录、视频等,对恐怖行为发生前进行预警和事后分析排查。
王元卓所在中国科学院计算技术研究所研发的社会化媒体数据的感知与处理技术与系统曾获得北京市科学技术奖。这些技术可以实现对重点监控人员的关联关系数据进行深度挖掘,依据人物关系进行关联查询,并对查询出的人物关系进行扩展、过滤,最后自学习能力很强的大数据会构造出一个人物关系网络,然后在这个关系网络的基础上,依据群体发现、群体演化分析等技术进行犯罪团伙的识别、定位等。例如:对一些前科人员进行分析,就可以找到和这些前科人员有密切关联的其他人员。
王元卓解释,异构数据是指不同类型的数据,包括文本、图片、视频等多种类型。刑侦人员可以对与嫌疑人有关的多种来源的异构数据进行时空分析,采用数据挖掘技术寻找数据内部的规律,从各类数据中寻找职业犯罪人员,根据案件类型、时间、空间等等人物特征及周边信息来对犯罪分子进行时空轨迹分析。比如:根据案件发生地点的地理位置信息进行关联查询,获取事件地点周边范围内所有相关重点社会场所信息,再对该社会场所内的近一段时期内所有进出人员信息进行统计分析,统计出进出敏感场所频率最高的人员,之后对这些人员进行数据比对,从中搜索是否有前科人员信息,并将这部分人员列为重点对象,然后围绕这些重点人员展开调查。这些数据,都可以得出可视化分析结果,提供给警方作为调查证据。
▲在天津市公安局东丽分局合成作战中心,一位专业技术民警在对监控信息进行分析
基于异常行为的区域人员往返数据分析方法是国内预防犯罪比较先进的方法,可以发现恐怖分子的异常行为。正常情况下两个地区人员的往来人次数据会维持在一个正常的水平,因此如果发现某两个地区之间人员的往来次数发生突变,则认为可能会有异常事件的发生。警方通过监控航空、火车、汽车等公共交通数据,对两地流通人员的往返人次数据进行异常监控,可对往返人次数量设定阈值,对高于阈值的情况进行异常的预警。正常情况下,某地区进入人次会维持在一个固定的范围内,若某段时间内人次数量突然增加,则认为可能会有异常情况,系统会预警并提前做出预防。■