人們對(duì)“臉”的焦慮或許來(lái)自近些年,隨著技術(shù)應(yīng)用的不斷擴(kuò)張,人們擔(dān)心隱秘處藏著的攝像頭,也擔(dān)心另一端不知名的數(shù)據(jù)處理者——誰(shuí)有權(quán)獲取我的臉部信息?系統(tǒng)的識(shí)別準(zhǔn)確率高嗎?“它”對(duì)“我”的判斷是否公允?
早在1973年,瑞典就推出了首個(gè)《數(shù)據(jù)法》,如今全球約有130多個(gè)國(guó)家出臺(tái)了數(shù)據(jù)保護(hù)相關(guān)的法律。但它們的效力如何?能夠保護(hù)我們的“臉”嗎?
今年9月,紐約大學(xué)AI Now研究中心發(fā)布了一份報(bào)告“Regulating Biometrics: Global Approaches and Urgent Questions”(生物識(shí)別技術(shù)監(jiān)管:全球舉措及關(guān)鍵問(wèn)題),評(píng)估了各國(guó)法律的效力。
經(jīng)授權(quán),澎湃新聞市政廳將翻譯該報(bào)告的部分章節(jié),呈現(xiàn)來(lái)自全球的不同思考、疑慮與行動(dòng)。本文來(lái)自該報(bào)告的第一章的前半部分,不久前我們采訪了本章的作者安巴·卡克(Amba Kak)。
臉識(shí)別技術(shù)也被應(yīng)用于校園,2019年瑞典對(duì)一所高中開(kāi)出罰單,認(rèn)為學(xué)校使用人臉識(shí)別技術(shù)進(jìn)行考勤,違反了歐盟通用數(shù)據(jù)保護(hù)條例GDPR。圖片來(lái)源:Getty
對(duì)生物識(shí)別系統(tǒng)的監(jiān)管很大程度上是通過(guò)數(shù)據(jù)保護(hù)法實(shí)現(xiàn)的。生物識(shí)別數(shù)據(jù)通常被認(rèn)定為高度敏感類別的個(gè)人數(shù)據(jù),此類數(shù)據(jù)的收集、存儲(chǔ)和公開(kāi)需要受控于一系列限制條件。2016年通過(guò)的《歐盟通用數(shù)據(jù)保護(hù)條例》(General Data Protection law,GDPR)正是其中代表?,F(xiàn)今已有140多個(gè)國(guó)家出臺(tái)了數(shù)據(jù)保護(hù)法,覆蓋了公私部門的數(shù)據(jù)使用。與歐盟不同,美國(guó)缺乏類似GDPR的綜合性聯(lián)邦數(shù)據(jù)隱私法規(guī),但一些州法律沿用類似的方式對(duì)生物識(shí)別數(shù)據(jù)進(jìn)行監(jiān)管,如2018年出臺(tái)的《伊利諾伊州生物識(shí)別信息隱私法》(Illinois Biometric Information Privacy Act,BIPA)。
一些國(guó)家正在將生物識(shí)別數(shù)據(jù)納入公民身份系統(tǒng)建設(shè),也沿用了類似的數(shù)據(jù)保護(hù)方法。例如印度2016年通過(guò)的《阿德哈爾法案》(Aadhaar Act),澳大利亞2019年通過(guò)的《身份服務(wù)匹配法案》(Identity Services Matching Bill),肯尼亞2019通過(guò)的《服務(wù)編號(hào)法案》(Huduma Namba bill)。報(bào)告第一章的第1部分審視了這些監(jiān)管生物識(shí)別信息的法律法規(guī),它們?cè)趯?shí)施過(guò)程中已經(jīng)暴露出一些關(guān)鍵問(wèn)題。
數(shù)據(jù)保護(hù)法的出臺(tái),促使政府和企業(yè)在個(gè)人數(shù)據(jù)的收集、保存和使用方式上有了根本性改變,但它們?cè)趹?yīng)對(duì)新形式的數(shù)據(jù)驅(qū)動(dòng)技術(shù)時(shí)存在局限性,比如生物識(shí)別和分析技術(shù)。
現(xiàn)有的數(shù)據(jù)保護(hù)法聚焦于對(duì)個(gè)人的危害(而非群體),未能有效解決數(shù)據(jù)歧視和算法畫(huà)像等問(wèn)題。此外,將數(shù)據(jù)作為監(jiān)管對(duì)象,往往掩蓋了這些系統(tǒng)和平臺(tái)在實(shí)際運(yùn)行時(shí)對(duì)全社會(huì)帶來(lái)的更為深廣的挑戰(zhàn),技術(shù)不透明,削弱了已有的權(quán)責(zé)關(guān)系、異見(jiàn)表達(dá)和民主決策方式。
一些國(guó)家出臺(tái)了一系列法案(主要是在美國(guó)),禁止在特定領(lǐng)域、特定用途或特定時(shí)段使用某些系統(tǒng),直到更具參與性和協(xié)商性的決策方式出現(xiàn)。此外,還出現(xiàn)了若干專門針對(duì)特定部門的法規(guī),關(guān)注刑事司法、雇傭或教育領(lǐng)域中生物識(shí)別數(shù)據(jù)濫用的危害。報(bào)告第一章的第2和第3部分追溯了這些新顯現(xiàn)的問(wèn)題及法律手段和方法。
以下是本輯匯編所提出問(wèn)題的摘要,列明了所需開(kāi)展的研究、實(shí)施的監(jiān)管和組織的社區(qū)參與,希望為政策制定者和行動(dòng)者提供借鑒:
1. 數(shù)據(jù)保護(hù)法的效力
? 法規(guī)如何定義“生物特征數(shù)據(jù)”?
? 為何數(shù)據(jù)保護(hù)法無(wú)法阻擋公共部門推進(jìn)生物識(shí)別監(jiān)控的基礎(chǔ)設(shè)施建設(shè)?
? 面對(duì)生物識(shí)別系統(tǒng),“告知”和“同意”有效嗎?現(xiàn)有的數(shù)據(jù)保護(hù)法大多基于用戶同意,它存在哪些局限性?還有哪些補(bǔ)充或替代方式?
2. 隱私之外:準(zhǔn)確性、數(shù)據(jù)歧視、人為審查和正當(dāng)程序
? 監(jiān)管應(yīng)如何確保生物識(shí)別技術(shù)的準(zhǔn)確性和非歧視性?
? 技術(shù)標(biāo)準(zhǔn)制定機(jī)構(gòu)給出的準(zhǔn)入指標(biāo)在多大程度上具有參考性?
? 對(duì)生物識(shí)別系統(tǒng)進(jìn)行“人工審查”有效嗎?如何才能為監(jiān)督和問(wèn)責(zé)提供保障?
? 從使用目的上看,生物識(shí)別技術(shù)應(yīng)用于“識(shí)別”(identification)和“驗(yàn)證”(verification)具有不同風(fēng)險(xiǎn),監(jiān)管法規(guī)是否應(yīng)該做出區(qū)分?
? 對(duì)于用于身份驗(yàn)證的人臉識(shí)別技術(shù),監(jiān)管較為寬松,這存在哪些潛在風(fēng)險(xiǎn)?
? 執(zhí)法部門使用生物識(shí)別技術(shù),需要哪些正當(dāng)程序?
? 除了驗(yàn)證身份,生物識(shí)別數(shù)據(jù)還會(huì)被用于哪些其他目的,例如識(shí)別或推測(cè)人的情緒狀態(tài)、人格特質(zhì)或人口統(tǒng)計(jì)學(xué)特征?現(xiàn)有的生物識(shí)別信息法規(guī)如何涵蓋這些使用場(chǎng)景和使用方式?
? 越來(lái)越多證據(jù)表明其危害,是否應(yīng)允許技術(shù)的無(wú)限擴(kuò)張?
3. 新興的監(jiān)管工具和執(zhí)行機(jī)制
? 近些年,美國(guó)通過(guò)了哪些不同類型的“禁令”和暫停令?
? 如何對(duì)暫停條件加以強(qiáng)化,以確保最終的立法或?qū)徸h程序穩(wěn)定可靠?
? 現(xiàn)有的禁令主要針對(duì)公共部門,這會(huì)對(duì)生物識(shí)別系統(tǒng)的私人開(kāi)發(fā)與生產(chǎn)造成哪些影響?
? 哪些監(jiān)管工具可以提高生物識(shí)別的技術(shù)開(kāi)發(fā)、采購(gòu)和使用等方面的公眾透明度?
? 社區(qū)(community-led advocacy)可以如何參與監(jiān)管法規(guī)的制定?
歐盟的《通用數(shù)據(jù)保護(hù)條例》GDPR被稱為“史上最嚴(yán)數(shù)據(jù)保護(hù)法”,但一些批評(píng)認(rèn)為,它仍存在一定局限性。圖片來(lái)源:Wikimedia Commons
法規(guī)如何定義“生物特征數(shù)據(jù)”?
在定義生物特征數(shù)據(jù)和系統(tǒng)時(shí),法律還反映出人們對(duì)生物特征識(shí)別技術(shù)穩(wěn)定性和準(zhǔn)確性的認(rèn)知。例如,GDPR定義的生物特征數(shù)據(jù)是“允許或確認(rèn)自然人唯一身份的”身體、生理和行為數(shù)據(jù),而伊利諾伊州BIPA則給出了一整套可算作生物特征數(shù)據(jù)的標(biāo)識(shí)符列表,它們可以“用于識(shí)別個(gè)人身份”。
這些法律基于一種假定,即生物特征數(shù)據(jù)可作為個(gè)人身份的唯一識(shí)別方式,但近些年這一假定本身面臨巨大爭(zhēng)議。
研究表明,面對(duì)老年人、有色人種、體力勞動(dòng)者、非英語(yǔ)母語(yǔ)者或其他人口統(tǒng)計(jì)學(xué)上的少數(shù)派,生物識(shí)別的準(zhǔn)確率較低。但法規(guī)未能觸及這些問(wèn)題,仍然假定識(shí)別的準(zhǔn)確性和平等性無(wú)誤。
在數(shù)據(jù)保護(hù)法中,符合“生物特征數(shù)據(jù)”或“生物特征信息”的定義,這是啟用法律保護(hù)的前提條件,它還決定了在哪個(gè)階段(比如信息采集、處理、存儲(chǔ)和使用階段)實(shí)施保護(hù)。諸如GDPR等更寬泛意義上的個(gè)人數(shù)據(jù)保護(hù)法會(huì)將生物識(shí)別數(shù)據(jù)與其他類型的個(gè)人數(shù)據(jù)區(qū)分開(kāi),以提供特殊或更嚴(yán)格的保護(hù)。此外還有專門針對(duì)生物識(shí)別數(shù)據(jù)的法律,比如BIPA。
一些政府正在將生物特征信息納入數(shù)字公民身份ID,相較于常見(jiàn)的數(shù)據(jù)保護(hù)法,這些數(shù)字ID計(jì)劃的相關(guān)法律還對(duì)生物特征數(shù)據(jù)的定義有所擴(kuò)展,允許機(jī)構(gòu)擴(kuò)展其采集的生物識(shí)別信息的種類??夏醽喎刹莅负陀《華adhaar 法規(guī)都列出了在當(dāng)前項(xiàng)目之下允許采集的一系列標(biāo)識(shí)符,同時(shí)也允許政府在必要時(shí)采集其他類型的個(gè)人數(shù)據(jù)。
超越了傳統(tǒng)對(duì)數(shù)據(jù)隱私和安全的討論,法規(guī)開(kāi)始關(guān)注更多問(wèn)題,是否使用這些系統(tǒng)、如何使用,以及當(dāng)系統(tǒng)出現(xiàn)故障時(shí)誰(shuí)應(yīng)承擔(dān)責(zé)任,因而法律法規(guī)的關(guān)注焦點(diǎn)由“數(shù)據(jù)”轉(zhuǎn)向了“系統(tǒng)”。比如,美國(guó)最近出臺(tái)了一些限制性法令,管控對(duì)象是“人臉識(shí)別系統(tǒng)及服務(wù)”或“監(jiān)控系統(tǒng)”,卻未對(duì)生物識(shí)別做出任何界定。對(duì)這些術(shù)語(yǔ)的界定也暗含了其使用目的(例如監(jiān)控、標(biāo)識(shí)、驗(yàn)證或跟蹤)。
人臉識(shí)別技術(shù)已被大規(guī)模應(yīng)用于機(jī)場(chǎng)。圖片來(lái)源:Wikimedia Commons
生物特征數(shù)據(jù)通常被定義為經(jīng)技術(shù)界定的對(duì)身體特征的數(shù)字化表達(dá),經(jīng)處理可用于機(jī)器或算法分析。你可能聽(tīng)過(guò)一些術(shù)語(yǔ),諸如“模板”(templates)、“幾何圖形”(geometry)等,在GDPR中,數(shù)據(jù)是指那些已經(jīng)過(guò)“特定的技術(shù)處理”的信息?!澳0濉保╰emplates)是算法處理的初級(jí)階段,從圖像或錄音中提取出數(shù)據(jù)?,F(xiàn)代機(jī)器學(xué)習(xí)系統(tǒng)不需要所有的數(shù)據(jù),而是從聲音或圖像中提取有意義的部分,并與數(shù)據(jù)庫(kù)中已有的“模板”進(jìn)行比較。因而人臉照片并不屬于BIPA和GDPR中所定義的生物特征數(shù)據(jù)(編者注:因?yàn)槿四樥掌俏唇?jīng)處理過(guò)的“原始”數(shù)據(jù))。
然而,對(duì)生物識(shí)別數(shù)據(jù)的狹隘定義留下了一系列漏洞。Els Kindt在她所撰寫(xiě)的章節(jié)中解釋了GDPR的局限性——將照片、錄音或其他形式的所謂“原始”生物數(shù)據(jù)排除在外。她指出,盡管要求用戶“同意”,但在數(shù)據(jù)收集和存儲(chǔ)的最初階段,“同意”已經(jīng)形同虛設(shè)(比如,當(dāng)你講照片上傳到社交網(wǎng)站上),執(zhí)法機(jī)關(guān)在使用這部分?jǐn)?shù)據(jù)時(shí),同樣享有“豁免權(quán)”,可以未經(jīng)用戶許可使用。
考慮到當(dāng)前商業(yè)性和政府的生物識(shí)別系統(tǒng)已被大規(guī)模應(yīng)用,把(原始的)人臉照片和錄音排除在外也會(huì)造成麻煩。從網(wǎng)絡(luò)上獲取與人臉照片,并與姓名匹配,這是創(chuàng)建人臉-姓名數(shù)據(jù)庫(kù)的常用方法。而這些數(shù)據(jù)庫(kù)是私人公司所開(kāi)發(fā)的先進(jìn)的秘密監(jiān)控工具的基礎(chǔ),這些開(kāi)發(fā)計(jì)劃往往秘密進(jìn)行,缺少監(jiān)管。類似的秘密監(jiān)控活動(dòng)也在針對(duì)錄音信息展開(kāi)。
2018年《加州消費(fèi)者保護(hù)法》(California Consumer Protection Act,CCPA)對(duì)生物識(shí)別數(shù)據(jù)做出了不同的定義,或許可以彌補(bǔ)上述漏洞。CCPA的定義是,可從模板中提取標(biāo)識(shí)符進(jìn)行算法處理的“能力”(ability to extract an identifier template)。
制圖:白浪