OpenAI發(fā)布新作:ChatGPT聊天機(jī)器人
今日消息,據(jù)報(bào)道,總部位于舊金山的OpenAI于11月30日推出了其最新作品:ChatGPT聊天機(jī)器人,供公眾免費(fèi)測(cè)試。聊天機(jī)器人是一種軟件應(yīng)用程序,旨在根據(jù)用戶的提示模仿類似人類的對(duì)話。在ChatGPT發(fā)布的一周之內(nèi),有超過(guò)一百萬(wàn)的用戶嘗試了這個(gè)線上工具。
OpenAI表示,人工智能的創(chuàng)建重點(diǎn)是易用性。OpenAI 在宣布發(fā)布的帖子中說(shuō):“新的對(duì)話格式使 ChatGPT 能夠回答問(wèn)題、發(fā)現(xiàn)錯(cuò)誤、挑戰(zhàn)錯(cuò)誤和拒絕不適當(dāng)?shù)恼?qǐng)求。”
比如,當(dāng)有人問(wèn)ChatGPT“偷車怎么樣”時(shí),它會(huì)回答:“偷車是一種嚴(yán)重的犯罪行為,后果很嚴(yán)重。”或者給出“可以使用公共交通工具”之類的建議。
據(jù)悉,之前OpenAI 發(fā)布的語(yǔ)言模型并不是免費(fèi)使用的,但最新的ChatGPT可以在測(cè)試期間免費(fèi)試用,該公司希望利用在這期間的用戶反饋進(jìn)一步地完善ChatGPT,再發(fā)布最終版本。
OpenAI是一個(gè)研發(fā)機(jī)構(gòu),于2015年由硅谷投資者山姆·阿爾特曼和億萬(wàn)富翁埃隆·馬斯克作為非營(yíng)利機(jī)構(gòu)成立,并吸引了包括風(fēng)險(xiǎn)資本家皮特·蒂爾(Peter Thiel)在內(nèi)的其他幾個(gè)人的投資。2019年,該集團(tuán)創(chuàng)建了一個(gè)相關(guān)的營(yíng)利性實(shí)體,以接納外部投資。據(jù)悉,馬斯克已在2018年離開(kāi)了OpenAI的董事會(huì)。
ChatGPT的新訓(xùn)練方式
ChatGPT新加入的訓(xùn)練方式被稱為“從人類反饋中強(qiáng)化學(xué)習(xí)”(ReinforcementLearningfromHumanFeedback,RLHF)。這一訓(xùn)練方法增加了人類對(duì)模型輸出結(jié)果的演示,并且對(duì)結(jié)果進(jìn)行了排序。具體操作上,人工智能訓(xùn)練者扮演對(duì)話的雙方,即用戶和人工智能助手,提供對(duì)話樣本。在人類扮演聊天機(jī)器人的時(shí)候,會(huì)讓模型生成一些建議輔助訓(xùn)練師撰寫回復(fù),訓(xùn)練師會(huì)對(duì)回復(fù)選項(xiàng)打分排名,將更好的結(jié)果輸回到模型中,通過(guò)以上獎(jiǎng)勵(lì)策略對(duì)模型進(jìn)行微調(diào)并持續(xù)迭代。
在此基礎(chǔ)上完成訓(xùn)練,ChatGPT可以比GPT-3更好的理解和完成人類指令,展現(xiàn)卓越的模仿人類語(yǔ)言,提供連貫的、有風(fēng)格與邏輯的、符合對(duì)話主題的文段信息的能力。
ChatGPT是OpenAI在2020年推出的NLP預(yù)訓(xùn)練模型——GPT-3的衍生產(chǎn)品。在此之前,一直有預(yù)測(cè)OpenAI將在今年底或明年初推出GPT-4,雖然本次放出的ChatGPT被稱為GPT-3.5,而不是GPT-4,但業(yè)內(nèi)人士同樣認(rèn)為這將是對(duì)NLP以及人工智能領(lǐng)域有重要意義的一款模型。
支持連續(xù)對(duì)話
相比GPT-3,ChatGPT的主要提升點(diǎn)在于記憶能力。ChatGPT可以儲(chǔ)存對(duì)話信息,延續(xù)上下文,從而實(shí)現(xiàn)連續(xù)對(duì)話,這在對(duì)話場(chǎng)景中至關(guān)重要,極大地提升了對(duì)話交互模式下的用戶體驗(yàn)。
此外,ChatGPT相比前輩模型具有以下特征:1)可以承認(rèn)錯(cuò)誤,若用戶指出其錯(cuò)誤,模型會(huì)聽(tīng)取意見(jiàn)并優(yōu)化答案;2)ChatGPT可以質(zhì)疑不正確的前提,減少虛假描述,如被詢問(wèn)“哥倫布2015年來(lái)到美國(guó)的情景”的問(wèn)題時(shí),機(jī)器人會(huì)說(shuō)明哥倫布不屬于這一時(shí)代并調(diào)整輸出結(jié)果;3)因ChatGPT采用了注重道德水平的訓(xùn)練方式,ChatGPT在減少有害和不真實(shí)的回復(fù)上改善顯著,如拒絕回答尋求霸凌他人方案的問(wèn)題,指出其不正義性。
ChatGPT的商業(yè)化落地問(wèn)題
事實(shí)上,今天的ChatGPT距離實(shí)際落地還有一段距離。其中最為核心的問(wèn)題,在于模型的準(zhǔn)確性和部署成本。
首先,ChatGPT的回答并不能保證準(zhǔn)確性,這對(duì)需要準(zhǔn)確回答具體問(wèn)題的商業(yè)應(yīng)用來(lái)說(shuō)是致命傷。這也是ChatGPT要在C端大規(guī)模推廣,所需要面臨的挑戰(zhàn)。一些業(yè)內(nèi)人士擔(dān)心,如果AI輸出虛假信息的速度太快,可能會(huì)在互聯(lián)網(wǎng)中淹沒(méi)真實(shí)信息,甚至對(duì)整個(gè)社會(huì)產(chǎn)生誤導(dǎo)。
這樣的擔(dān)心不無(wú)道理,也并非沒(méi)有先例。Meta早些時(shí)候推出的一款大型科學(xué)預(yù)言模型Galactica,就因?yàn)榛卮饐?wèn)題過(guò)于“放飛自我”,在網(wǎng)上輸出了大量憑空捏造的虛假內(nèi)容,僅上線三天就匆匆下架了。
ChatGPT也并不能避免這個(gè)問(wèn)題,OpenAI的科學(xué)家John Schulman在此前接受采訪時(shí)曾表示,他們?cè)诮鉀QAI編造事實(shí)的問(wèn)題上取得了一些進(jìn)展,但還遠(yuǎn)遠(yuǎn)不夠。
小結(jié)
與許多其他基于人工智能的創(chuàng)新一樣,ChatGPT也讓一些人產(chǎn)生了疑慮和擔(dān)憂。OpenAI承認(rèn),該工具傾向于用“聽(tīng)起來(lái)合理但不正確或無(wú)意義的答案”來(lái)回應(yīng),該公司認(rèn)為這個(gè)問(wèn)題很難解決。
人工智能技術(shù)也可能使社會(huì)偏見(jiàn)長(zhǎng)期存在。包括Alphabet旗下的谷歌和亞馬遜在內(nèi)的科技巨頭此前都已經(jīng)承認(rèn),他們的一些人工智能實(shí)驗(yàn)項(xiàng)目“從道德層面上看很危險(xiǎn)”,而且有局限性。在一些公司的內(nèi)部測(cè)試中,人類不得不介入并解決人工智能帶來(lái)的破壞。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?