脸部辨识可能没你想的那幺神,但造就冤狱已经绰绰有余:《打开演

作者:    2020-08-01 03:34:11   735 人阅读  883 条评论

「中国已经把用于新疆地区的脸部辨识技术,扩大到全中国其他地区,监控操作更精密,甚至可以辨识特定族群,维吾尔族人疑似成为锁定目标,被加强监控。」──纽约时报

脸部辨识可能没你想的那幺神,但造就冤狱已经绰绰有余:《打开演

汉娜‧弗莱(Hannah Fry)

译|林志懋

  脸部辨识演算法在现代治安作为当中正开始普及起来。这些演算法收到相片、监视录影或3D摄影机快照,就会侦测脸部、测量其特徵,并与已知脸部资料库做比对,企图确定相片中人的身分。

  在柏林,能够辨识已知恐怖主义嫌犯的脸部辨识演算法被训练来鉴识经过火车站的群众。在美国,二○一○年以来,这些演算法光是在纽约州,仅仅针对诈欺和身分盗用就发动了超过四千次逮捕行动。而在英国,现在把摄影机架在交通工具上面,看起来像加强版的Google街景车,自动四处开来开去,交叉比对我们和通缉犯资料库的相似度。这些厢型车第一次成功找到目标是在二○一七年六月,一辆车从南威尔斯一名男子身旁开过去,而当地警方已对这名男子发出逮捕令。

  我们的安全和保安往往取决于我们的脸部鉴定与辨识能力,但这项任务交在人类手上,可能会有风险。以海关官员为例,最近有一项研究模拟机场保安设施,这些脸孔辨识专家未能发现身分证不符的比率达惊人的百分之十四──而完全合格者则有百分之六误遭驳回。我不知道你怎幺想,但我觉得,当你考量到每天通过希斯洛机场的人数,这些数字不只是令人有点焦虑而已。

  我们稍后会看到,脸部辨识演算法当然可以把这项任务做得比人类好。但用于追捕罪犯时,鉴识错误的后果是如此严重,而这些演算法的运用引发一项重大问题。把两个人的身分弄错,到底有多容易?我们之中有多少个一副塔利脸的正潜伏在外头某处?

脸部辨识可能没你想的那幺神,但造就冤狱已经绰绰有余:《打开演

  一项从二○一五年开始进行的研究显示,你在自己的真实生活中拥有分身的机会(无论是银行抢匪或其他)小到几乎为零。阿德雷德大学的泰涵.露卡丝(Teghan Lucas)千辛万苦在四千人的照片中做了八种脸部测量,其中连一组相符的都找不到,让她得出结论:两个人要有完全相同脸孔的机率低于一兆分之一。根据这项计算,塔利不光是运气有「一点」背而已。考量到他那位兆中选一的邪恶分身也住在附近,而且碰巧是名罪犯,我们应该可以预期要在几万年之后,才会有另一个倒楣的人落入同样的悲惨经验。

  但有些理由让人怀疑这些数字不太兜得起来。想像遇上和你脸孔相同的某人当然难,但长得很像却毫无关係的陌生人,这类轶闻证据看起来确实比露卡丝研究可能显示的讯息要常见许多。

  以尼尔.道格拉斯(Neil Douglas)来说吧,他搭机要前往爱尔兰时才发现,他的分身就坐在他的位子上。在他们的自拍照里,后面有满满一飞机的旅客与他们同笑,这张照片很快像病毒般传播开来。不久之后,世界各地留着络腮鬍、红头髮的人寄来自己的照片,证明他们也有相似的长相。「我想,我们可以组成一支小型军队了,」道格拉斯告诉BBC。

  我甚至有自己的故事可以添上一笔。我二十二岁的时候,有个朋友给我看一张他们在当地乐团Myspace的网页上看到的照片。那是一场我没去过的演唱会上所拍照片的拼贴图,显示很多人乐在其中,而其中一人看起来眼熟得令人毛骨悚然。为了确认我没有在某天晚上失去知觉,出门游蕩去了如今想不起来有参加过的派对,我寄了电子邮件给乐团主唱,他确认了我的怀疑:我那爱好电子合成流行乐的分身,有着比我更精采的社交生活。

  因此,塔利、道格拉斯和我,就是各有至少一名分身的这种人,可能还不只一名。在七十五亿人口中,我们加起来就有三人,而且我们还没开始认真算人头呢──这样已经远超过露卡丝估算的一兆分之一。

  有一个理由可以解释这种落差。一切都归因于研究人员对「等同」的定义。露卡丝的研究要求,两个人的测量结果必须完全相合。即便道格拉斯和貌似他的人像到不可思议,如果有一个鼻孔或一片耳垂相差多达一毫米,根据她的判準,他们严格说来不算是分身。

  但就算你比较的是同一个人的两幅影像,精确的测量并不会反映出我们每一个人是如何持续在改变,由于年老、疾病、疲惫、我们所做的表情,或我们的脸如何因摄影机角度而被扭曲。想以几毫米之差来捕捉脸的本质,那幺你在同一个人脸上所发现的变异之多,将一如你在人与人之间察觉到的。简单说,单凭测量无法区分两张脸孔。

  虽然这两张脸孔或许不完全等同,但一点都不难想像自己会把道格拉斯和照片中他那素昧平生的分身给弄混。塔利的情况类似,他和真正的抢匪看起来甚至没有那幺相似,但影像还是被联邦调查局专家错误解读,以至于他被控以未曾犯过的罪名,扔进最高保安等级的牢房。

脸部辨识可能没你想的那幺神,但造就冤狱已经绰绰有余:《打开演

  正如海关官员所显示的,把不熟悉的脸孔弄混,即使这些脸孔只是略有相似,惊人地容易。结果证明,人类出乎意料地拙于辨识陌生人。这就是为什幺我的朋友声称,她是耐着性子勉强看完克里斯多福.诺兰(Christopher Nolan)摄製优美的电影《敦克尔克大行动》(Dunkirk)──因为她要花很大的力气来分辨这些演员。这是为什幺青少年发现,「借」年长朋友的身分证去买酒颇有成功的机会。这也是为什幺根据美国非营利法律扶助组织「清白专案」(Innocence Project)评估,在百分之七十以上的冤案中,目击证人误认发挥了某种作用。

  不过,虽然目击者或许很容易将道格拉斯与他的同机旅伴弄混,他的母亲当然可以毫无问题地从照片中认出她儿子──即使说的是真实生活中的分身:一对完全相同的双胞胎,如果你和他们只是泛泛之交,或许容易弄混,但只要你对他们有正确认识,分辨他们同样容易。

  这里有一个关键点:相似性取决于观者的角度。没有严格定义相似性,你无法测量两张脸孔有多幺不同,我们也就没有一个标準可以说两张脸孔完全相同。你无法定义何谓分身,或是说某一张特定脸孔有多常见;最重要的,你也说不出两幅影像摄自同一人的机率为何。

  这意味着脸部辨识做为一种鉴识法,不像DNA是自豪地端坐在强大的统计学平台之上。把DNA检测法用于刑事鉴识,罪犯特徵剖析的焦点是放在基因组的特定区块上,这些区块已知在人类身上会有高度变异。该变异的程度是关键所在:如果犯罪现场发现的身体组织样本DNA序列与取样自嫌犯身上的序列吻合,代表你可以计算两者来自同一人的机率。也意味着,你可以说出某个倒楣家伙碰巧就在那些点上有相同DNA序列的精确机率。你使用的标记越多,比对错误的机率越低,所以藉由选择所要测试的标记数量,全世界每一个司法系统都完全能够决定他们愿意容忍的疑虑限度。

  即便我们觉得自己的脸孔与我们是何许人有如此本质性的关联,如果不知道人类身上的变异性,以脸孔来指认重犯的做法得不到严谨科学的支持。说到以照片认人,借用联邦调查局鉴识单位的说法:「缺乏统计,意味着这些结论最终都是奠基于个人看法。」

  不幸的是,用演算法来做脸部辨识并未帮我们解决此一难题,这是对于运用演算法来指认罪犯一事提高警觉的极佳理由。相像和相同不是同一回事,而且从来不是同一回事,无论演算法变得多精準。

  而且,另外还有一个要对脸部辨识演算法步步为营的好理由。这些演算法并非真如你想的那般善于辨识脸孔。

(本文为《打开演算法黑箱:反噬的AI、走钟的运算,当演算法出了错,人类还能控制它吗?》部分书摘)

脸部辨识可能没你想的那幺神,但造就冤狱已经绰绰有余:《打开演

书籍资讯

书名:《打开演算法黑箱:反噬的AI、走钟的运算,当演算法出了错,人类还能控制它吗?》 Hello World: How to Be Human in the Age of the Machine

作者:Hannah Fry

出版:脸谱

[TAAZE] [博客来]