AI戴上有色眼鏡:你在機器眼中是好人還是壞蛋?
大眾的認(rèn)知中,人工智能的決策都是絕對理性與客觀的,因為我們知道背后驅(qū)使它的是冷冰冰卻比千言萬語更接近事實的數(shù)據(jù),然而,近期專家發(fā)現(xiàn),人工智能其實也會帶著有色眼鏡去看人。
據(jù)國外媒體報道,斯坦福大學(xué)的一項研究顯示,亞馬遜、蘋果、谷歌、IBM和微軟的語音識別系統(tǒng)存在種族差異,在白人用戶中出現(xiàn)的錯誤,要比在黑人用戶中少得多。
研究顯示,這五大科技公司的語音識別系統(tǒng)在白人中錯誤識別單詞的概率為19%。而在黑人用戶中,則提升至35%。此外,大約2%的白人音頻片段被這些系統(tǒng)認(rèn)為是不可讀的。而在黑人用戶中,這一比例卻高達(dá)20%。
美國國家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)也曾測試了兩種最常見的人臉識別算法,得出了四點結(jié)論:
1. 在一對一匹配中,大多數(shù)系統(tǒng)對亞裔和非裔美國人比對白人面孔的假陽性匹配率更高,有時是10倍甚至100倍。
2. 這種情況在亞洲國家發(fā)展的人臉識別算法中有所改變,在亞洲和白人之間,假陽性的差異非常小。
3.美國開發(fā)的算法始終不擅長匹配亞洲、非洲裔美國人和美洲原住民的面孔。美國原住民得到的是錯誤率最高。
4. 在一對多的配對中,非裔美國女性的假陽性率最低,這使她們被錯誤指控犯罪的風(fēng)險最高。
事實上,早在2015年就已經(jīng)存在計算機視覺技術(shù)犯錯的例子,表明人工智能技術(shù)存在對女性和有色人種的偏見,實例包括Google 等科技業(yè)巨頭所提供的高人氣網(wǎng)絡(luò)服務(wù),Google 照片應(yīng)用程序(Google Photos app)被發(fā)現(xiàn)將非裔美國人標(biāo)記為「大猩猩」,谷歌曾也為此進(jìn)行公開道歉。
在探討如何消除人工智能的不客觀之前,我們先來看看AI的有色眼鏡到底從何而來。
數(shù)據(jù)是“罪魁禍?zhǔn)住?/strong>
現(xiàn)階段讓AI提升認(rèn)知世界能力的最有效途徑仍然是監(jiān)督學(xué)習(xí),而目前AI算法能學(xué)習(xí)的數(shù)據(jù),幾乎全部都是通過人力逐一進(jìn)行標(biāo)注而得來的,數(shù)據(jù)集質(zhì)量的高低直接決定最終模型的效果。
數(shù)據(jù)標(biāo)注者通常是人類,而人類是“復(fù)雜”的生物。這也是導(dǎo)致AI產(chǎn)生偏見的一個主要因素,大多數(shù)機器學(xué)習(xí)任務(wù)都是使用大型、帶標(biāo)注的數(shù)據(jù)集來訓(xùn)練,AI會基于開發(fā)者提供的訓(xùn)練數(shù)據(jù)推斷出規(guī)律,再將規(guī)律套用在某些資料中。
打個比方,在人臉識別應(yīng)用中,如果用于訓(xùn)練的數(shù)據(jù)里白人男性比黑人女性更多,那白人男性的識別率將會更高。
導(dǎo)致AI產(chǎn)生偏見另一個原因可以歸于算法本身,一個常見的機器學(xué)習(xí)程序會試圖最大化訓(xùn)練數(shù)據(jù)集的整體預(yù)測準(zhǔn)確率。
有缺陷的算法還會造成惡性循環(huán),使偏見越發(fā)嚴(yán)重。例如谷歌翻譯,會默認(rèn)使用男性代詞,這是因為英語語料庫中男性代詞對女性代詞的比例為2:1。
算法的原則是由AI自行進(jìn)行學(xué)習(xí),乍看之下很有效率。不過,一但提供的資料不夠全面,或開發(fā)者沒有想方設(shè)法避免歧視,AI推導(dǎo)出的結(jié)果便很容易帶有偏見。
AI并不理解“偏見”
偏見這個詞是人類創(chuàng)造的,也是人類定義的,AI并不能理解偏見的含義。
機器學(xué)習(xí)的方法會讓AI帶上了有色眼鏡,但是改變 AI 學(xué)習(xí)的方式也不是好的解決方式。
或許我們應(yīng)該從自己身上找找原因,畢竟導(dǎo)致AI產(chǎn)生偏見的原因,有部分要歸咎于他們所使用的語言。人們需要弄清楚什么是偏見,以及偏見在語言中的傳遞過程,避免這些偏見在日益強大的 AI 應(yīng)用中更大范圍的傳播。
前微軟副總裁沈向洋博士曾在公開課《打造負(fù)責(zé)任的AI》中指出:“人工智能已經(jīng)開始做出人類無法理解的決定了,我們需要開啟人工智能的黑箱,了解AI做出決定背后的原因!
算法之所以會對人類進(jìn)行區(qū)別對待,原因在于訓(xùn)練算法用的基準(zhǔn)數(shù)據(jù)集通常是來自新聞和網(wǎng)頁的數(shù)據(jù),就存在著由語言習(xí)慣造成的“性別偏見”,算法也自然“繼承”了人類對這些詞匯理解的性別差異。
AI技術(shù)距離完全消除技術(shù)偏見還有很長的一段路,但各大巨頭也已經(jīng)在技術(shù)層面做出努力。
谷歌開源了一項名為“What-If Tool”的探測工具,IBM將研發(fā)的偏見檢測工具—AI Fairness 360 工具包開源,包括超過 30 個公平性指標(biāo)(fairness metrics),和 9 個偏差緩解算法,研究人員和開發(fā)者可將工具整合至自己的機器學(xué)習(xí)模型里,檢測并減少可能產(chǎn)生的偏見和歧視。
寫在最后
人類的行為是收到外界影響的,而這種語言傳統(tǒng)中出現(xiàn)的偏見,是在人文歷史中不斷加深嵌入的,在“偏見”通過代碼傳播之際,我們必須弄清楚,是否簡單的語言學(xué)習(xí)就足以解釋我們觀察到傳播中出現(xiàn)的偏見。
最重要的是大眾需要了解“偏見”從何而來,從而在社會中消除這種不文明的“偏見”。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?