為什么要讓AI價值對齊?
文/陳根
隨著AI大模型進入各行各業(yè)的應用,以及AI技術的持續(xù)迭代,關于AI是否會威脅人類的討論也越來越多。
其實這樣的討論過去也有很多,甚至從AI技術誕生開始,就有人在擔憂AI會不會有一天取代人類,或者威脅人類這個物種的存在。
只不過,今天,AI大模型的爆發(fā),讓這個問題一下子從抽象的討論變得非常具體。我們必須要思考,我們該怎么迎接即將到來的AI時代;必須要面對,如果AI的性能以及達到人類水平甚至超越人類水平時,我們人類該怎么辦,以及未來AI會不會有一天真的具有了意識,那個時候,人機發(fā)生沖突該又怎么解決。
而面對這些問題時,有一個概念也被人們重新提起,那就是“價值對齊”。這其實也不是一個新的概念,但這個概念放在今天好像特別合適。那么,到底什么是價值對齊?誰和誰的價值對齊?又怎么對齊?
簡單來說,價值對齊,其實就是讓AI的價值觀和我們人類的價值觀對齊,而之所以要讓AI的價值觀和我們人類的價值觀對齊,核心目的就是為了安全。
大家可以想象一下,如果不對齊,會有什么后果。
比如哲學家、牛津大學人類未來研究所所長Nick Bostrom,曾經就提出一個經典案例。就是說,如果有一個能力強大的超級智能機器,我們人類給它布置了一個任務,就是要“制作盡可能多的回形針”,于是,這個能力強大的超級智能機器就不擇手段的制作回形針,把地球上所有的人和事物都變成制作回形針的材料,最終摧毀了整個世界。
這個故事其實早在古希臘神話里就發(fā)生過。說的是一位叫邁達斯的國王,機緣巧合救了酒神,于是酒神就承諾滿足他的一個愿望,邁達斯很喜歡黃金,于是就許愿,希望自己能點石成金。結果邁達斯真的得到了他想要的,凡是他所接觸到的東西都會立刻變成金子,但很快他就發(fā)現這是一個災難,他喝的水變成了黃金,吃的食物也變成了黃金。
大家從這兩個故事里有沒有發(fā)現一個問題,不管是超級智能機器還是邁達斯,它們都是為了自己的目的,最后超級智能機器完成了回形針任務,邁達斯也做到了點石成金,但得到的結果卻是非常災難的。因為在這個過程中,它們缺少了一定的原則。
這就是為什么今天價值對齊這個概念會被重新重視的原因。AI根本沒有與人類同樣的關于生命的價值概念。在這種情況下,AI的能力越大,造成威脅的潛在可能性就越大,傷害力也就越強。
因為如果不能讓AI 與我們人類“價值對齊”,我們可能就會無意中賦予AI與我們自己的目標完全相反的目標。比如,為了盡快找到治療癌癥的方法,AI可能會選擇將整個人類作為豚鼠進行實驗。為了解決海洋酸化,它可能會耗盡大氣中的所有氧氣。這其實就是系統(tǒng)優(yōu)化的一個共同特征:目標中不包含的變量可以設置為極值,以幫助優(yōu)化該目標。
事實上,這個問題在現實世界已經有了很多例子,今年11月,韓國慶尚南道一名機器人公司的檢修人員,被蔬菜分揀機器人壓死,原因是機器人把他當成需要處理的一盒蔬菜,將其撿起并擠壓,導致其臉部和胸部受傷嚴重。而后他被送往醫(yī)院,但因傷重而不治身亡。
除此之外,一個沒有價值對齊的AI大模型,還可能輸出含有種族或性別歧視的內容,幫助網絡黑客生成用于進行網絡攻擊、電信詐騙的代碼或其他內容,嘗試說服或幫助有自殺念頭的用戶結束自己的生命等等。
好在當前,不同的人工智能團隊都在采取不同的方法來推動人工智能的價值對齊。OpenAI、谷歌的DeepMind各有專注于解決價值對齊問題的團隊。除此之外,還有許多第三方監(jiān)督機構、標準組織和政府組織,也將價值對齊視作重要目標。這也讓我們看到,讓AI與人類的價值對齊是一件非常急迫的事情,可以說,如果沒有價值對齊,我們就不會真正信任AI,人機協(xié)同的AI時代也就無從談起。
原文標題 : 陳根:為什么要讓AI價值對齊?

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?