您的位置:首頁>正文

大數據真的值得盲目崇拜嗎?新研究表明大資料預估演算法大有問題!

導語:累犯, 就是被判有罪的人受罰之後再次犯罪的情況。 目前, 有關部門通常利用一些預測演算法來估算這個比率。 這個演算法的結果對犯人來說很重要,

它既可能影響最終判決, 又可能決定能否假釋, 不過這種基於大資料的預判演算法確實有大多數法官認為的那麼可靠嗎?

為了檢測演算法在實際中的準確程度, 由達特茅斯學院的研究人員Julia Dressel和Hany Farid領導的一個研究小組對一款廣泛使用的商業風險評估軟體(COMPAS)開展了研究,

該軟體又被稱為“罪犯改造管理分析”。

這款軟體是用來預測一個人在定罪後的兩年內是否會再次犯罪。

然而, 該研究的結果顯示, COMPAS預測累犯率的準確度並不比沒有刑事司法從業經歷的志願者們高多少。 Dressel和Farid在一個網站上招募了一群志願者, 並隨機分配給每人一小部分刑事案件中被告的資訊。 包括性別, 年齡和以前的犯罪史等。 研究人員要求他們根據手頭的資料, 去預測犯人是否會在未來兩年內再次犯罪。

最終結果顯示, 志願者預測的平均準確率為62.1%, 準確率中位數為64.0%, 這已經非常接近COMPAS的準確度:65.2%了。

此外, 研究人員發現, 儘管COMPAS會對多達137個資訊項進行分析以得出結果, 但使用只考慮兩項被告資訊(被告的年齡和先前的定罪次數)的線性預測法時居然也能得出幾乎一樣的結果。 這足以體現, 這種號稱精確的演算法其實並不完美。

演算法偏見問題

該團隊關心的一個方面是演算法可能會具有“偏見”。

在他們的研究中, 志願者和COMPAS在預測黑人被告的累犯率時都表現出相似的虛高誤判率——儘管他們在做出預測時並不知道被告的種族。 黑人被告的誤判率是37%, 而白人被告只有27%。 這些志願者誤判的比率和COMPAS的比率相當接近:黑人被告40%, 白人被告25%。

在論文的討論中, 該研究小組指出,

“黑人和白人被告在逮捕率上具有較大的差異, 使得不同種族間誤判率和漏判率的比較變得更為複雜了。 ”

這方面的研究得到了美國有色人種協進會提供的資料支援, 例如協進會發現“美國黑人和白人吸毒率大致相同, 但黑人因吸食毒品而受到監禁處罰的概率幾乎是白人的6倍”。

論文的合著作者們在論文中指出, 即使犯人的種族沒有明確說明, 但參考資料的某些方面也可能與種族相關, 從而導致預測結果的差異。

事實上, 當團隊為新志願者提供犯人種族資料並讓他們再次預估累犯率時, 結果還是大致相同。 該小組因此得出結論:“告知志願者時排除種族並不能完全消除累犯預測中的種族差異”。

重複的結果

圖|大資料預測演算法真的可靠嗎

自從1998年以來,COMPAS已被用於評估超過100萬人(雖然其累犯預測功能直到2000年才被推出,但這也足以體現它預測誤差的後果可能已經影響甚廣)。

考慮到這龐大的基數,此次研究的結果如下:演算法的精度甚至不超過一群沒有刑事司法從業經歷的志願者,著實令人震驚。長久以來究竟犯了多少錯誤,影響了多少被告的正常保釋,細思恐極。

顯而易見,這種預測演算法遠不夠精確複雜,需要及早改進、更新。該團隊用相同的資料訓練了一個功能更強大的非線性支援向量機(NL-SVM),以驗證他們的發現。

圖|預測演算法的起源

然而,向量機還是產生了與之前相似的結果,研究人員認為這是因為他們對演算法進行了過於接近真實資料的訓練,從而使實驗結果“反彈”回了原點。

Dressel和Farid表示,他們之前還專門只使用80%的資料對新向量機進行了演算法訓練,然後用剩下的20%資料進行測試,就是為了避免“過度擬合”——即當真實數據使用過多、演算法對資料的親和度過高後,演算法的準確性會受到影響。

什麼是預測演算法?

圖|什麼是預測演算法?

最後,研究人員得出結論,也許這種累犯估計所討論的資料根本就不是線性可分的,這意味著無論多麼複雜的預測演算法,都不會是預測累犯率的有效方法。

考慮到被告的未來一定程度上是被估計結果決定的,達特茅斯學院的研究團隊認為在使用這些演算法做出決定前,一定要仔細斟酌。

“想像一下,你是一個法官,你在裁決時使用了一款商用評估軟體,它說:我們使用大資料進行分析後認為這個人是高風險的,於是你就聽信了它的一家之言。”Farid說。

“現在再想像一下,我告訴你,我在網上隨機找了10個人對被告的累犯率進行了同樣的預測,這就是他們預測的結果。你會輕易相信我這10個人的預測嗎?顯然不會。然而,這10個人的預測和所謂軟體大資料評估的精度是相同的。這就是之前十多年司法系統做的蠢事:輕信演算法。”

這種預測演算法不僅用於刑事司法系統。 實際上,我們每天都會遇到它們:它們幾乎遍佈日常生活的方方面面:從網路上的產品廣告到流媒體服務的音樂推薦,幾乎無處不在。

圖| 無處不在的預測演算法

但是,在新聞採訪中出現的廣告遠不及對犯罪者的裁決重要。廣告成功與否只關乎一家之利,但對罪犯的裁決卻關乎他們之後的整個人生和全社會的穩定。要做到裁決公正,我們不能僅僅盲目輕信演算法。對大資料預測演算法進行何種程度的改進,對於現在的我們,還任重道遠。

編輯 | 褚茗帆

審校 | 星亦

TechPower科技力

熱愛因科技而發生

重複的結果

圖|大資料預測演算法真的可靠嗎

自從1998年以來,COMPAS已被用於評估超過100萬人(雖然其累犯預測功能直到2000年才被推出,但這也足以體現它預測誤差的後果可能已經影響甚廣)。

考慮到這龐大的基數,此次研究的結果如下:演算法的精度甚至不超過一群沒有刑事司法從業經歷的志願者,著實令人震驚。長久以來究竟犯了多少錯誤,影響了多少被告的正常保釋,細思恐極。

顯而易見,這種預測演算法遠不夠精確複雜,需要及早改進、更新。該團隊用相同的資料訓練了一個功能更強大的非線性支援向量機(NL-SVM),以驗證他們的發現。

圖|預測演算法的起源

然而,向量機還是產生了與之前相似的結果,研究人員認為這是因為他們對演算法進行了過於接近真實資料的訓練,從而使實驗結果“反彈”回了原點。

Dressel和Farid表示,他們之前還專門只使用80%的資料對新向量機進行了演算法訓練,然後用剩下的20%資料進行測試,就是為了避免“過度擬合”——即當真實數據使用過多、演算法對資料的親和度過高後,演算法的準確性會受到影響。

什麼是預測演算法?

圖|什麼是預測演算法?

最後,研究人員得出結論,也許這種累犯估計所討論的資料根本就不是線性可分的,這意味著無論多麼複雜的預測演算法,都不會是預測累犯率的有效方法。

考慮到被告的未來一定程度上是被估計結果決定的,達特茅斯學院的研究團隊認為在使用這些演算法做出決定前,一定要仔細斟酌。

“想像一下,你是一個法官,你在裁決時使用了一款商用評估軟體,它說:我們使用大資料進行分析後認為這個人是高風險的,於是你就聽信了它的一家之言。”Farid說。

“現在再想像一下,我告訴你,我在網上隨機找了10個人對被告的累犯率進行了同樣的預測,這就是他們預測的結果。你會輕易相信我這10個人的預測嗎?顯然不會。然而,這10個人的預測和所謂軟體大資料評估的精度是相同的。這就是之前十多年司法系統做的蠢事:輕信演算法。”

這種預測演算法不僅用於刑事司法系統。 實際上,我們每天都會遇到它們:它們幾乎遍佈日常生活的方方面面:從網路上的產品廣告到流媒體服務的音樂推薦,幾乎無處不在。

圖| 無處不在的預測演算法

但是,在新聞採訪中出現的廣告遠不及對犯罪者的裁決重要。廣告成功與否只關乎一家之利,但對罪犯的裁決卻關乎他們之後的整個人生和全社會的穩定。要做到裁決公正,我們不能僅僅盲目輕信演算法。對大資料預測演算法進行何種程度的改進,對於現在的我們,還任重道遠。

編輯 | 褚茗帆

審校 | 星亦

TechPower科技力

熱愛因科技而發生

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示