訂閱
糾錯(cuò)
加入自媒體

AI時(shí)代,蝴蝶和海嘯之間只隔一個(gè)錯(cuò)誤

長(zhǎng)三角MOMO

如果一篇論文錯(cuò)信了“AI幻覺(jué)”,會(huì)造成多米諾骨牌效應(yīng),引發(fā)一連串的數(shù)據(jù)錯(cuò)誤復(fù)發(fā),怎么破?用魔法打敗魔法,還是要靠AI工具。

開(kāi)頭講兩個(gè)故事。

第一個(gè)故事,關(guān)于普遍性。

現(xiàn)在的學(xué)生和老師,都在普遍地使用AI。前幾天去親戚家串門(mén),他正在教育他閨女不要用AI寫(xiě)作文了,一定要自己寫(xiě)。結(jié)果她閨女特別委屈地方告訴他:這是老師讓的,老師說(shuō)寫(xiě)完之后,要傳給AI,讓AI給出修改意見(jiàn)。

前段時(shí)間,我去參加了一個(gè)大學(xué)教授和我們這些民間自媒體從業(yè)者的論壇,我特意問(wèn)了關(guān)于使用AI的問(wèn)題,答案是老師們也在普遍用AI做課件。

第二個(gè)故事,關(guān)于準(zhǔn)確性。

前段時(shí)間,良渚的自來(lái)水事件,鬧得沸沸揚(yáng)揚(yáng),但是突然有個(gè)信息沖了出來(lái),說(shuō)農(nóng)夫山泉在良渚有工廠,一時(shí)間快速發(fā)酵,幸虧事件查的及時(shí),發(fā)這個(gè)微博的博主很快刪除了信息,并且道了歉,說(shuō)是AI上查到的信息,搞錯(cuò)了。一句搞錯(cuò),差點(diǎn)給企業(yè)釀成大禍。

很顯然,AI在過(guò)去的兩年中,已經(jīng)證明了自己能夠給出比傳統(tǒng)搜索更優(yōu)質(zhì)答案的能力,人們也更愿意毫無(wú)底線地相信AI的答案,這種相信,在教授、媒體、教師、學(xué)術(shù)界、科學(xué)界、行政公務(wù)中都普遍存在,但是我們有沒(méi)有想過(guò)一個(gè)問(wèn)題,如果AI在這些嚴(yán)肅學(xué)科領(lǐng)域,犯了良渚農(nóng)夫山泉那個(gè)錯(cuò),帶來(lái)的后果會(huì)是什么?

我覺(jué)得就是蝴蝶效應(yīng)。

一個(gè)媒體報(bào)道,或者一篇論文,用錯(cuò)一個(gè)數(shù)據(jù)之后,會(huì)引發(fā)一連串的數(shù)據(jù)錯(cuò)誤復(fù)發(fā),最終徹底讓AI陷入一種認(rèn)知錯(cuò)誤,誤導(dǎo)后面所有的人,這是一個(gè)多米諾的關(guān)系。

百度文心,最近弄了一個(gè)“放心寫(xiě)”功能,大大提高了媒體和教育行業(yè)的AI使用確定性,我實(shí)話實(shí)說(shuō),之前為了確保數(shù)據(jù)不出錯(cuò),我還是會(huì)對(duì)比幾個(gè)AI一起交叉驗(yàn)證,然后再配合權(quán)威媒體的報(bào)道,確保自己不出錯(cuò),現(xiàn)在有了這個(gè)功能,直接把寫(xiě)好的文章,傳給文心,有什么問(wèn)題直接就會(huì)給我標(biāo)注出來(lái),我在線就可以修改,二次再審。

這等于給每個(gè)寫(xiě)作者,加了一道風(fēng)控,有沒(méi)有數(shù)據(jù)錯(cuò)誤,有沒(méi)有政策解讀錯(cuò)誤,有沒(méi)有論點(diǎn)論據(jù)錯(cuò)誤,我在內(nèi)部開(kāi)玩笑,我們行業(yè)的校對(duì)可以徹底下崗了,的確,我們公司的校對(duì)下崗很久了。

為什么學(xué)術(shù)界、媒體界是AI最應(yīng)該關(guān)注的對(duì)象?因?yàn)锳I的很多數(shù)據(jù)來(lái)源要取自這里,如果這里出錯(cuò),會(huì)交叉污染數(shù)據(jù),所以百度文心現(xiàn)在用“放心寫(xiě)”,堵住這個(gè)交叉污染的可能性,是抵制AI幻覺(jué)的一個(gè)非常有效的手段。 

我也試用了一下,拿“最近汽車(chē)行業(yè)監(jiān)管政策解讀”這個(gè)問(wèn)題生成了一篇文章,具體細(xì)節(jié)和最終成果我就不展開(kāi)說(shuō)了,只說(shuō)結(jié)論:質(zhì)量很可用,以對(duì)話助手的方式,達(dá)到了我以前用某些大模型的智能體的水平。

 

圖片

 這個(gè)檢驗(yàn)過(guò)程有意思,提示未通過(guò)部分,我專門(mén)查了一下,為什么AI判定「歐盟《新電池法》要求2027年動(dòng)力電池回收利用率達(dá)到95%」不通過(guò)?原來(lái)法案是針對(duì)不同材料的,確實(shí)不能一概而論,很?chē)?yán)謹(jǐn)。

 

圖片

再次重寫(xiě)后通過(guò),下載分享也很絲滑。

還有一點(diǎn)要提示,記住要把左下角的“事實(shí)校對(duì)”打開(kāi)。

近期還看到一條訊息,LMArena大模型競(jìng)技場(chǎng)新發(fā)布了最新排名,文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名中國(guó)第一,特別是在創(chuàng)意寫(xiě)作等方面表現(xiàn)突出。

值得點(diǎn)贊,不管從模型上還是應(yīng)用上,文心在中文寫(xiě)作方面都很強(qiáng)勁,目前在文心APP最新版本可以體驗(yàn)最新的模型能力了。我了解到,放心寫(xiě)中文寫(xiě)作準(zhǔn)確率已經(jīng)超過(guò)了99%,幻覺(jué)率大大降低。

總之,我覺(jué)得未來(lái)如果要確保AI不產(chǎn)生過(guò)多幻覺(jué),“放心寫(xiě)”還真是一條可行之路。

首先,數(shù)據(jù)庫(kù)如何建立?

既然是一個(gè)幫助用戶避免AI幻覺(jué)的寫(xiě)作工具,那就是要有一個(gè)屬于自己的細(xì)分?jǐn)?shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)不是開(kāi)放式的,“放心寫(xiě)”采用的數(shù)據(jù)庫(kù)都是權(quán)威可信機(jī)構(gòu)媒體和政府官網(wǎng),并沒(méi)有從海量的互聯(lián)網(wǎng)數(shù)據(jù)中去辨別,幻覺(jué)往往是因?yàn)殄e(cuò)誤信息權(quán)重大于正確信息之后,產(chǎn)生的結(jié)果。而且這種干擾,目前來(lái)看,是完全可實(shí)行的。

所以,用來(lái)二次辨別的工具,數(shù)據(jù)庫(kù)一定不是開(kāi)放式全網(wǎng)數(shù)據(jù)。

其次,在小細(xì)分領(lǐng)域循環(huán)。

現(xiàn)在,文心“放心寫(xiě)”對(duì)于公文、教育課件、行業(yè)報(bào)告、會(huì)議紀(jì)要等領(lǐng)域,已經(jīng)有強(qiáng)大的復(fù)盤(pán)能力,但是這種能力有個(gè)特性,就是服務(wù)辦公室工作比較多,并不是偏向娛樂(lè)和個(gè)人化需求,基本都是嚴(yán)肅話題,在這種特定場(chǎng)景中,數(shù)據(jù)就更容易保持干凈,這種干凈就可以傳染給外面的大數(shù)據(jù)庫(kù)。

第三,能夠幫助新手快速上手工作。

其實(shí),對(duì)于很多辦公室新人,甚至新教師來(lái)說(shuō),如何規(guī)范自己的行文,規(guī)范自己的課件,是一件非常頭疼的事,因?yàn)檫@些東西,往往都有固定的格式,其實(shí)不需要太多個(gè)性化的東西,但是這個(gè)格式需要經(jīng)驗(yàn),文心“放心寫(xiě)”除了可以檢測(cè)錯(cuò)誤之外,也可以幫你根據(jù)你提供的參考文檔調(diào)整格式。

在過(guò)去的一年時(shí)間里,AI在很多公司,有了一個(gè)新名字,背鍋俠。

以前,公司里的人們辦公過(guò)程中出了錯(cuò),會(huì)把鍋甩給供應(yīng)商,說(shuō)是供應(yīng)商的錯(cuò),但是現(xiàn)在大家發(fā)現(xiàn),AI也可以承接這種錯(cuò)誤,這從側(cè)面也說(shuō)明了一個(gè)問(wèn)題,AI幻覺(jué)的確普遍性存在,是一個(gè)現(xiàn)實(shí)問(wèn)題。

無(wú)數(shù)的專家在擔(dān)憂,我們社會(huì)未來(lái)的信息安全問(wèn)題,人類在未來(lái),到底還能不能真的分辨出哪些信息是真實(shí)的,哪些是AI杜撰出來(lái)的,今年良品鋪?zhàn)拥幕ㄉ郑籄I做出了一張花生長(zhǎng)在樹(shù)上的圖,成了鬧劇,事實(shí)上,這種事情,以后這會(huì)越來(lái)越多。

百度這次做“放心寫(xiě)”,算是從反方向做了一次嘗試,AI不僅僅可以是數(shù)據(jù)信息的提供者,也可以是數(shù)據(jù)信息的糾正者,幻覺(jué)可能是AI創(chuàng)造出來(lái)的,也可以是AI糾正的。

時(shí)間來(lái)到了2026年,AI的競(jìng)爭(zhēng)很顯然會(huì)陷入一種白熱化,功能上的差異越來(lái)越小,那么下半場(chǎng)大家比什么?如果一個(gè)問(wèn)題,所有AI給出的答案都大差不差,那么用誰(shuí)都一樣。那么如果一個(gè)問(wèn)題,有一個(gè)AI能夠給出不一樣的答案,并且能夠做到錯(cuò)誤率很低,或者不出錯(cuò),這就是勝算。 

確保自己和物理世界的強(qiáng)關(guān)聯(lián),不出現(xiàn)幻覺(jué),對(duì)自己的交付負(fù)責(zé),這就是我心中AI后面的取勝法寶。

AI,在2026年,不能變成人們犯錯(cuò)的背鍋俠,而應(yīng)該是糾錯(cuò)俠。

       原文標(biāo)題 : AI時(shí)代,蝴蝶和海嘯之間只隔一個(gè)錯(cuò)誤

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)