訂閱
糾錯
加入自媒體

美國五大科技巨頭語音識別系統(tǒng)歧視黑人?網(wǎng)友給出新視角

近年來,隨著人工智能概念的走紅和落地,全球掀起了一股智能化風(fēng)潮,為生物識別、機器視覺等產(chǎn)業(yè)的發(fā)展帶來了巨大利好。目前,以語音識別、人臉識別為代表的生物識別技術(shù)在世界各國得到了廣泛應(yīng)用,并加速實現(xiàn)規(guī)模化商用。

其中,語音識別技術(shù)的發(fā)展與應(yīng)用正越發(fā)成熟,智能音箱、聊天機器人、客服機器人等產(chǎn)品獲得了消費者的普遍認可。然而,近日斯坦福大學(xué)一項研究成果表明,亞馬遜、蘋果、谷歌、IBM和微軟這五大科技巨頭的語音識別系統(tǒng)可能存在種族差異。

該研究顯示,美國五大科技公司的語音識別系統(tǒng)在對白人用戶和黑人用戶的識別中,白人群體的錯誤率要比黑人群體少得多。此外,有高達20%的黑人用戶音頻片段被系統(tǒng)判定為不可讀。據(jù)此,斯坦福大學(xué)相關(guān)研究人員認為,這些公司的語音識別系統(tǒng)顯然存在歧視性。那么,真相是什么呢?

開發(fā)者因素影響

一般來說,借助人工智能技術(shù),語音識別系統(tǒng)等智能化產(chǎn)品都具備自我學(xué)習(xí)能力,可以根據(jù)開發(fā)者提供的數(shù)據(jù)資源進行自我訓(xùn)練,從而不斷成長、提高系統(tǒng)性能與服務(wù)水平,增強與人類用戶的溝通、理解能力。

但是在這一過程中,開發(fā)者提供的數(shù)據(jù)資源成為了關(guān)鍵。如果開發(fā)者本身存在種族偏見,選擇的數(shù)據(jù)資源也非常具有指向性,那么必然造成語音識別系統(tǒng)在初期學(xué)習(xí)中,就會養(yǎng)成類似種族偏見的“習(xí)慣”。

斯坦福大學(xué)的研究也表明,上述公司的語音識別系統(tǒng)在訓(xùn)練時,所使用的數(shù)據(jù)就顯得有些片面化,不夠多樣性。因此,語音識別系統(tǒng)在訓(xùn)練時如果得不到豐富、多元的數(shù)據(jù),形成“歧視觀念”就難以避免。

使用者因素影響

相對于在初期訓(xùn)練中具備的“本能”,語音識別系統(tǒng)在后期用戶使用過程中所受到的影響也是關(guān)鍵性的。如果語音識別系統(tǒng)的主要用戶是特定的某一群體,那么其持續(xù)自我學(xué)習(xí)數(shù)據(jù)的來源將變得非!皢握{(diào)”。

從目前美國市場的反饋來看,五大科技巨頭開發(fā)的語音識別系統(tǒng)更多的使用群體是白人,黑人用戶相對而言較少。所以,在白人用戶偏多而黑人用戶偏少的情況下,語音識別系統(tǒng)所收集、利用的數(shù)據(jù)多樣性不足,就會造成對特定用戶群體的識別準確率偏差。

所以,針對這種情況,相關(guān)企業(yè)應(yīng)當(dāng)重視起來,通過人為干預(yù)等方式,補充黑人群體、亞裔群體、拉丁裔群體等其他種族人群的語音信息,以保證語音識別系統(tǒng)在學(xué)習(xí)過程中接收信息的平衡性,從而盡量避免出現(xiàn)歧視后果。

口音因素影響

除了開發(fā)者、使用者所提供的數(shù)據(jù)存在多樣性問題外,很多網(wǎng)友認為,這和不同群體之間的口音差異也應(yīng)當(dāng)有一定關(guān)聯(lián)。相對于白人群體,其他種族的人群在發(fā)音上或多或少都會與之有差異,這可能是語音系統(tǒng)在識別方面有偏見的原因之一。

其實在我國,也存在地方方言導(dǎo)致語音識別有差異的情況。從大的方面來說,北方人和南方人的發(fā)音就不盡相同,就普通話識別來說,肯定是北方人的識別準確率更高。因此,方言、發(fā)音等因素也應(yīng)當(dāng)被考慮在內(nèi),而不是簡單地判定為種族偏見。

可以看出,語音識別系統(tǒng)要想繼續(xù)拓展市場還存在不少挑戰(zhàn),如果無法克服用戶群體傾向性、方言和發(fā)音等硬傷,那么顯然不利于語音識別產(chǎn)品實現(xiàn)進一步普及,也不利于其獲得更廣泛用戶的認可。對于語音識別行業(yè)來說,市場前景固然廣闊,但也必須努力克服眼下的困境,才能迎來真正的騰飛。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號