“连环杀手侦探”:通过算法比对,AI 能破获所有连环杀人案?

2017年12月22日 | By News | Filed in: News.

http://ift.tt/2paSNmv

编者按:自1976年以来美国共发生了75万起的凶杀案,但是破案率却屡创新低。据估计,每年美国有超过5000名杀人凶手逍遥法外,而在逃的连环杀手数量可能高达2000以上。有没有办法找出那些命案的相似之处,建立关联,从而揪出其中的连环杀手呢?Thomas Hargrove就是这么干的。他建立了美国最大的谋杀案档案库,开发了一个犯罪手法模式匹配算法,并且成立了一个非盈利组织专门来研究这件事。《纽约客》报道了他们的故事

Hargrove估计美国的连环杀手大概有2000人之多。

Thomas Hargrove是一位连环杀手档案管理员。过去七年来,他一直在收集谋杀案的地方记录,现在他已经建起了全美最大的谋杀案档案库——自1976年以来发生过的751785起谋杀案,这个数目甚至比FBI的档案还要多出约二万七千多份。按规定,各州应该向美国司法部汇报发生的谋杀案,但有些报告不准确或者不全面,Hargrove已经向其中一些州提出诉讼,要求获取相关档案。他还自己编写了计算机代码,用来搜索里面的存档,查找三角恋、抢劫或者斗殴等引起的略为普通的凶杀案在统计上的反常现象。美国每年犯命案而未被抓获的人数约为5000人,而且这些人当中一定比例者犯下命案次数不止一次。Hargrove打算揪出这些人,他的工具就是代码,有时候他称之为连环杀手侦探。

这个代码是一个简单的算法,Hargrove是在2010年,在现已倒闭的Scripps Howard新闻服务当记者的时候写的。这个算法成为了非盈利组织Murder Accountability Project(MAP)的基础。MAP由现已退休的Hargrove,一个数据库,一个网站以及九名成员组成,这些人当中有前侦探、研究杀人犯的学者、法医以及心理医生。算法通过数据汇总,收集了在手段、地点、时间,以及受害者性别方面存在相关性的凶杀案。同时它还会考虑某座城市凶杀案的未破案率是否显著,因为一名在逃的连环杀手会影响警察部门的破案率。从统计上来看,一个潜伏着连环杀手的城镇看起来简直就像法外之地。

2010年8月,Hargrove注意到印第安纳州莱克县(Gary市在其管辖范围内)的凶杀案有一定的模式。1980到2008年间,共有15名女性是被掐死的。而且其中的很多尸体是在空房内被发现的。Hargrove于是写信给Gary警察局,对这些凶杀案进行了描述,并且附上了相应情况的电子表格。他问道:“这些案子会不会反映出所在地区一或多名连环杀手的活动呢?”

警察局对他的热心漠不关心;一名探长说Garu这里没有未破的连环凶杀案(连环杀手在逃时美国司法部建议警察局要告诉市民,但一些地方对此还是保密)。Hargrove感到很气愤:“我给他们留言,还给警察局长和市长发挂号信。”后来,他从一名也开始怀疑Gary市有连环杀手的副验尸官那里得到了一些消息。她试图跟警方谈话,但也遭到了拒绝。在看了Hargrove的案子之中,她又给他的名单增补了3位受害者。

4年后,毗邻Gary市的Hammond警察局街道报案,称一家Motel 6汽车旅馆出了状况,有人在浴缸内发现了一具女尸。她的名字叫做Afrikka Hardy,年纪只有19岁。Hargrove说:“他们逮捕了一个叫做Darren Vann的家伙,就像这些案例经常发生的情况一样,他说,‘你们抓到我了。’在接下来的几天时间里,他领着警察去到被废弃的建筑物,警方又发现了6具女性尸体,全都是被掐死的,就像我们在算法里看到的手法一样。” Vann在1990年代初就杀死了他的第一个女人。2009年,他因为强奸而入狱,杀戮才停了下来。不过在2013年出狱后,Hargrove说:“他又恢复了之前的罪恶勾当。”

研究人员研究连环杀手的方式就好像他们是自然历史标本一样。Radford连环杀手数据库是其中最全面之一,它有来自世界各地的近五千个条目,其中大部分来自美国,是弗吉尼亚州Radford University退休教授Michael Aamodt 25年前开始编撰的。根据这个数据库,美国的连环杀手为男性的可能性要比女性高10倍。Ray Copeland,在上个世纪末在密苏里州他的农场里至少杀死了5名流浪汉,被捕时已经75岁的他是数据库中最老的连环杀手。最年轻的是Robert Dale Segee,他在缅因州的波特兰长大,被认为在1938年8岁的时候用石头砸死了一个女孩。他的父亲经常抓起他的手指到蜡烛火焰上烤来惩罚他,后来Segee就变成了一个纵火犯。纵火后他有时会产生幻觉,仿佛看到一个张牙舞爪脑袋冒火浑身通红的人。 1944年6月,Segee 14岁的时候在Ringling兄弟马戏团找到了一份工作。次月,马戏团帐篷着火,导致了168人丧生。 1950年,在因为另一起纵火案被捕后,Segee承认是他点着了帐篷,但几年后,他又翻供说当时自己已经疯了。

根据数据库的资料,连环杀手通常都不是特别聪明,平均智商为94.5。他们会分成若干类型。觉得自己必定要摆脱那些被视为不道德或不受欢迎的人——比如瘾君子、移民或者私生活混乱的女人的世界——的人被称为传教士。黑寡妇杀死男人,通常是为了继承财产或者骗取保险;残暴的丈夫杀死女人,要么是为了钱要么是为了显示自己的权力。杀死病人的护士被称为死亡天使。钓鱼的碰巧遇上了个受害者,而设陷阱的要么观察到了他的受害者,要么就是在某个地方,比如医院工作,而受害者不幸碰见了他。

FBI认为,每年由连环杀手实施的命案不到1%,但Hargrove却认为这个比例要更高些,而且美国大概有2000名连环杀手在逃。他说:“我是怎么知道的?几年前,我让FBI的人查了有记录在案的在逃但有DNA关联的杀手数量。”结果是大约有14000,这个数字略超他们查档杀手数的2%。Hargrove说:“那些还只是可以通过DNA锁定的案子数。而杀手未必总会留下DNA的——你能拿到DNA就是天赐的礼物。所以2个百分点是下限,而不是上限。”

Hargrove已经61岁。他身材比较高瘦,长着白胡子和一幅狐疑的眼神。他跟妻子和儿子住在弗吉尼亚州亚历山大市,每天都要走8英里的路,去到Mount Vernon,或者沿着波多马克河行走,一边听着电子书,通常是神秘小说的录音。他出生在曼哈顿,但他的父母在他小时候搬到了威彻斯特县的约克城。“4岁前我一直住在Riverside Drive。然后有一天我给我妈展示了在操场学会的东西,用Popsicle冰棍做成一把弹簧刀,我记得的下一件事就是我住在约克城了。”

Hargrove的父亲编写如何使用机械计算器的技术手册,Hargrove在密苏里大学上学时,学的是计算新闻学和公众舆论。他学会了用来进行民意调查的随机数字拨号理论等做法,并受到Philip Meyer的《精确新闻》鼓励记者从社会科学中学习调查方法的影响。 1977年毕业后,他被阿拉巴马州《伯明翰邮报》聘用,他的理解是自己会进行民意调查,并做报纸需要他做的其他任何事情。结果表明,该报需要的是一名犯罪记者。 1978年,Hargrove目睹了第一名男性死者,一名便利店老板在抢劫中被枪杀了。他还报道过一起骚乱,是在警方开枪打死一名十六岁的非洲裔美国女孩后爆发的。有一次,在到达一个对峙现场之后,他被水塔上的一个醉鬼用来复枪射击。子弹击中了他脚边的碎石。他还报道过一名叫做John Lewis Evans的男子的行刑,这是美国最高法院在1960、70年代废除死刑以来阿拉巴马州第一个被处决的囚犯。Hargrove说:“在阿拉巴马州,他们会把处极刑的犯人放到一张电椅上,那电椅还有个名字,叫做Yellow Mama,因为被涂上了亮黄色。由于距离上一次行刑的时间已经相去甚久,以至于已经没人记得怎么用了。第一次的时候,由于把过大的电流加载到太细的导线上,所以所有地方都着火了。每个人都在大叫,我好几天都睡不着觉。”

1990年,Hargrove搬到了华盛顿特区替Scripps Howard工作。他说在那里“我的主要目的是用数字震撼大家。”在研究美国社会保障管理局的死亡主档案(Death Master File,Hargrove说大家总有一天都会在上面)时,Hargrove注意到有些人某一年被列进去之后又在几年后被剔除出去了:也就是说某人被错误地宣布死亡了。从采访中他发现这些人的银行记录往往会被突然冻结,没法申请信用卡或者抵押贷款,并且工作申请往往会被拒绝因为通不过背景调查。在比较了不同邮编下的平民区危险儿童联邦补助金清单后,他发现有2/3的资金都是拨往郊区方向的。曾经坐在Hargrove邻桌的前记者Isaac Wolf说:“他做所有事情都是通过非常聪明的逻辑和编程来实现的,是足智多谋和创新思维的结合,通过耗时耗力的工作来收集和分析数据。”

2004年,Hargrove被派去调查一桩卖淫案的故事。为了了解哪些城市允许哪些不允许卖淫,他申请获取了一份联邦犯罪报告,FBI每年都会编撰这样的一份报告,随后他收到了一张包含从2002年以来的所有报告的CD。他说:“里面还附带有一份叫做‘S.H.R. 2002’的报告。”这是FBI的补充凶杀报告(Supplementary Homicide Report),里面列有所有向联邦调查局报备的凶杀案资料,包括年龄、种族、性别,以及受害者的种族,还列举了杀人的手段和情况介绍。Hargrove在查看的时候,“首先想到的是有没有可能教计算机认出连环受害者。” Hargrove说6年来他一直在跟Scripps Howard的每一位编辑说自己想用计算机找出连环杀手,而得到的回应总是,“你在玩笑,对吧?”

根据美国疾控中心的婴儿死亡率记录,佛罗里达州婴儿意外窒息的死亡人数要比加州高很多,尽管加州的婴儿数量更多。为了了解这背后的原因,2007年,Hargrove开始对婴儿猝死综合征(SIDS)进行调查。次年,Hargrove采访了美国全国各地的验尸官和病理学家。他说:“越来越多的人开始说,‘说实话,这么说可能会有麻烦,但SIDS其实并不存在。’” Hargrove于是推断认为SIDS不属于一种诊断或者神秘疾病,而是因为婴儿放进婴儿床的方式导致婴儿睡觉时被窒息。佛罗里达州往往把这些死亡归因为意外窒息,而加州则归因为SIDS。在他的故事报道出去之后,疾控中心建立了突然意外婴儿死亡病例登记档案来评估每一起死亡。新泽西州参议员Frank Lautenberg跟Hargrove会面后出台了突然死亡数据增强和意识法案(Sudden Death Data Enhancement and Awareness Act),2014年,这项法案由奥巴马总统签署生效。经过SIDS的故事之后,Hargrove在“新闻编辑部的地位高得出奇。”他告诉老板说他还是想教计算机侦查连环杀手,这次老板告诉他:“你有1年的时间。”

Hargrove开始申请调阅从1980年到2008的命案报告;其中包括了超过50万份熊山。他说,从一开始一就知道“计算机不知道的东西。我可以从数据中看到受害者。”他开始尝试编写算法来返回被定罪的凶手的受害者。他选择了Gary Ridgway作为测试用例,此人被称为Green River Killer(格林河杀手),从1980年代开始,他陆续在西雅图谋杀了48名女性,并将尸体抛弃在格林河边。Hargrove在办公桌上贴了一张Ridgway的照片,相片里的他看起来很疲倦,一脸的不高兴。在照片下面,他写道:“那些连环谋杀案的受害者在统计学上有何相似之处呢?”

建立算法是件累活。Isaac Wolf说:“他会写一些代码,然后用一堆看似没完没了的记录来进行测试。我们当时又没有昂贵的计算机设备,所以有时候会跑好几天。整个过程都是磕磕碰碰,他总是在修修补补。”

Ridgway最终被通过DNA比对识别出来,并在2001年被逮到了,当时他正要辞掉在Kenworth的一家载货卡车厂的工作,此前他已经在这家工厂当了32年的油漆工。但它告诉警察说掐女性脖子才是他的实际工作。他说:“我干的是掐脖子的工作,而且相当擅长。” Ridgway的妻子——第三任妻子对他的所为感到震惊。两人在Parents Without Partners(离异父母协会)聚会上相识,结婚已经有17个年头。她说他对自己一直都像新婚妻子那样。Ridgway曾经想过要杀死他的前两任妻子,但是考虑到太容易被抓到而作罢。基本上他杀掉的都是妓女,如果被杀掉的人身上正好带有钱的话,他会把那些钱当作是杀死她的酬劳而据为己有。

Hargrove每天都以前一天为什么失败的反省作为开始。他按照类型把凶杀案进行分类,因为有人告诉他连环杀手往往采用勒死或者棒击的手法,显然是因为他们更愿意让受害者没那么快死去。他选择的受害者对象是女性,因为FBI称70%的连环杀手受害者都是女性。每一次测试都要一天的时间。他都不知道有没有效。好一段时间内,唯一有希望的变量似乎是“无法解决”。Hargrove抬起手把右手拇指和食指并在一起说:“在尝试了100件不起作用的事情之后,然后才有了点见效的东西。我开始定得更具体,寻找一系列的因素——女性、武器、年龄以及位置等。”

通过这些要素,算法把凶杀案组织成了大概1万组。比方说:波士顿,女性,15到19岁,手枪就是其中一组。而新奥尔良、女性、20到50岁,窒息可能是另一组。既然“未能解决”已经产生出结果,哪怕是很无力的结果,Hargrove告诉计算机要通知他哪些地方的未破案率是特别低的。这方面西雅图排行第三,其中大多数受害女性都属于死因不明——不明是因为尸体都被抛弃在外面时间太长了,久到验尸官已经无法确定她们是怎么死的。Hargrove知道,计算机终于看到Ridgway的受害者了。

通过解读受害者与杀手的地理位置,Hargrove无意间已经运用了一门叫做犯罪空间情报分析(geographic profiling)的学科,前警察,现为德州州立大学刑事司法学院教授的Kim Rossmo是这方面的典范。1991年,Rossmo坐在日本的一趟列车上时想出了一个方程式,根据实施犯罪的地点以及尸体被发现的场所等因素,这个方程式可以用来预测连环杀手住在哪里。纽约市的一位凶杀案侦探说:“连环杀手的实施地点往往比较固定,会在集中的地区寻找牺牲品,这样的放是可以定义和检查的。”通常他们的猎场会远离他们居住地,但又不会是他们不熟悉的地方。犯罪分子跑得越远,其行动的可能性就越低,犯罪学家把这种现象称为是随距衰减。

Rossmo还利用犯罪空间情报分析来跟踪恐怖分子——他研究这些人住在哪里,武器藏在什么地方,以及用来打电话的公用电话亭的位置——还识别流行病是在什么地方开始的。他还跟动物学家一起协作,研究大白鲨的狩猎模式。最近,Rossmo研究了街头艺术家Banksy留下来的早期作品,找到了支撑英国《每日邮报》在2008年所做未获证实的论断的证据,当时该报纸称Banksy是一位来自布里斯托尔的中年男子,真名叫做Robin Gunningham。

Rossmo说:“说到谋杀调查,如果你避开好莱坞那一套的话,剩下的就是跟信息打交道。任何一桩连环谋杀案,警方需要调查的嫌疑人往往都有好几千,甚至好几万。”在格林河那件案子中,警方的名单就有1.8万人。“那么你该从何开始呢?关于犯罪的行程我们了解很多,通过留意谋杀发生地或者尸体被发现的地方,其实你可以建立概率分布。” Rossmo在他的《犯罪空间情报分析》一书中指出,研究发现,惯有右手的犯罪分子往往在逃跑的时候往左转,但是会把证据留到右边,而且大多数犯罪分子在躲藏进建筑物中的时候,会呆在靠近外墙的地方。

用计算机寻找凶手是由历史先例的。MAP成员之一,退休的凶杀案侦探,前FBI情报分析师Eric Witzig曾经参与了FBI的暴力犯罪逮捕计划(Violent Criminal Apprehension Program,ViCAP)。这个计划由是洛杉矶凶案侦探Pierce Brooks发起的。Brooks在50多岁的时候经办了Harvey Glatman的案子,此人就是后来臭名卓著的Lonely Hearts Killer。Glatman是一位广播电视维修工,也是一位业余摄影师,平时会邀请年轻女性给他当模特,说照片是给侦探杂志拍摄的。所以他会把受害者捆绑起来进行拍摄,可一旦受害者这被绑起来之后就再也不松绑了。Witzig说:“其中一位年轻女性受害者,不仅被绑起来,而且捆绑物的转角还非常的尖锐且精确,这表明罪犯从中享受到了极大的愉悦。”

Brooks开始研究一些杀手反复实施相同犯罪的方式。他把所有的凶案记录放到到3乘5英寸的卡片上,1950年代末,在对计算机感兴趣后,他向洛杉矶警察局提出请求,问能不能给他买一台。上面告诉他说太贵了。1983年,在FBI给他在Quantico提供了一份工作并且替他购买设备启动ViCAP之后,Brooks把制作命案跟踪计算机数据库的想法提交给了国会。这项计划的本意是给调查提供配套,但是侦探对此并不感冒。Witzig说:“首要原因也许是原先的ViCAP报告表格。” Brooks希望记录命案的每一个要素,因此要问答的问题超过了150个。Witzig说,这种情况下“用户当然会有抵触情绪了。没人喜欢太多的文书工作。”他还补充说该计划“得到了全世界执法方面最聪明的深度思考者的参与,但我们的MAP之所以存在是因为他们失败了。”

MAP也有自身的局限。由于算法依赖地点作为搜索选项,那些活动范围不局限在周边县市的凶手它就看不见了。此外MAP换回出现一种假阳性,Hargrove称之为Flint效应:在一些城市,比如Flint、密歇根,由于对命案的侦破太不上心了,以至于这些地方看起来就像受到了连环杀手的特别关照一样。

算法被放到了MAP的网站上,精通统计的人可以跑这个算法。其他不懂算法的人,可能也想知道有多少凶手尚未抓捕归案什么的,则可以使用网站的“搜索案件”功能。住在新奥尔良的Deborah Smith是一名MAP的搜索爱好者,同时也是业余侦探网上吹水论坛Websleuths的论坛管理员。她说:“我保留了全国被谋杀或失踪女性的名单及相关统计数据,同时还重点标注了那些我认为存在关联的命案。我把每个州的数据都保留下来,这些都是从MAP获取的,如果我关注了一名凶手,比如说Israel Keys,这个人15年前住在西雅图,我就会寻找西雅图以及阿拉斯加部分地区的命案,因为他也曾在那里住过,然后看看有没有被警方忽视的东西。”她还补充说:“这方面MAP特别特别有用。其他地方都找不到这样的工具。”

不过,MAP的小组尚未决定用算法的发现来做什么,而且这个问题还会给Hargrove造成道德和实践上的困难。他说:“我们必须确定我们的参与规则。在什么情况下我们才可以找警察?”一个月前,Hargrove通知克利夫兰警方,称似乎大概有60桩命案,受害者全都是女性,可能跟一位连环杀手有关,或者按照实施手段来看,也许是3名连环杀手所为。其中12名女性犯有卖淫罪,尸体在两个不同的地理分布区被发现。Hargrove不愿透露跟克利夫兰警方的交谈细节,因为MAP的规则要求此类沟通必须是私密的。警方给我写信称,在看到Hargrove的分析后,“考虑派一小组人翻查几单未决的命案。”该局特别调查小组的负责人是James McPike,他告诉MAP的人说:“我们准备跟你们一起合作,看看可以做些什么。”

Hargrove对调查感到满意,但他也担心搞错了。他问道:“如果题目抓错了人然后被对方告了该怎么办?2010年还是记者的时候我联络了一批警察局,因为我想看看算法是不是有效。现在我知道它有效了——我脑子里的疑惑已经解开了。在特定城市我们有信心说‘这些受害者有共同杀手的可能性更高。’但2010年的时候我背后有一家大的媒体公司,还有律师和媒体保险做后盾。但现在我是一个人,经营的这家非盈利组织在银行只有1400美元,董事会有9位董事,还没有保险。”

MAP的最大公益在于它让大家意识到了美国的命案破获率之低。1965年的时候,一起命案的破案率超过了92%。2016年的时候这个数字还不到60%,是有记录以来的最低点。洛杉矶的破案率最高,为73%,底特律最低,只有14%。就像MAP董事会成员,东北大学非典型谋杀研究小组(Atypical Homicide Research Group)主任Enzo Yaksic所说那样,该项目“说明了外面还有一大批没有被抓获的杀人犯。”

MAP的另一位董事会成员Michael Arntfield是西安大略大学的一位教授,他管理着一个铁证悬案社团。该社团关注的是这一算法的最大发现,也就是过去40年在亚特兰大地区总共100桩未破案的女性被杀案。这些受害者大部分都是非洲裔美国人,而且全都是被掐死的。Arntfield从亚特兰大警方那里弄到了44位女性的名字,现在一直在了解她们更多的信息。(研究敏感受害者的背景,希望能够发现他们是怎么遇到杀手的,这属于一门学科,叫做被害人学。)Arntfield和他的同事把受害者分成了两组:一组规模略小,是年纪稍大的女性,都是在家中遇害的。另一组年轻女性规模较大,其中很多都是妓女。Arntfield从报纸报道中发现,有两名男性实施犯罪的手法非常类似,现在都已经入狱。亚特兰大重案组负责人Adam Lee说警方尚未将这些命案跟特定杀人犯关联,但他说他认为MAP是一个有用的工具,并且对“跟Arntfield坐下来一起谈谈很感兴趣。”

Hargrove说他希望侦探最终会开始用这样算法来建立案件之间的关联,而MAP将会帮助找出凶犯。与此同时,他正在考虑建立一个比较网站,希望用这个网站来跟踪纵火案,并且他已经在开始编译着火方面的数据,只是现在还没有时间发布出去。他说:“连续纵火案跟连环谋杀案之间存在着关联。很多家伙都是从烧东西开始的。”

我们沿着亚历山大市河边在走路,这是Hargrove平时经常走的一条路线,他说:“我们的主要目的是收集尽可能多的记录。但这些记录是非常强大,非常诱人的。只需要查看这些记录就能识别出连环杀手。在不同的地方不同的年份,你会看到类似恐怖的事情的发生。”

原文链接:http://ift.tt/2B41zF3

编译组出品。编辑:郝鹏程。

IT.数码

via 36氪 http://36kr.com

December 22, 2017 at 01:10PM


发表评论

电子邮件地址不会被公开。 必填项已用*标注