123,123,123

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

AI時(shí)代，蝴蝶和海嘯之間只隔一個(gè)錯(cuò)誤

2025-12-31 17:19

長三角MOMO

如果一篇論文錯(cuò)信了“AI幻覺”，會(huì)造成多米諾骨牌效應(yīng)，引發(fā)一連串的數(shù)據(jù)錯(cuò)誤復(fù)發(fā)，怎么破？用魔法打敗魔法，還是要靠AI工具。

開頭講兩個(gè)故事。

第一個(gè)故事，關(guān)于普遍性。

現(xiàn)在的學(xué)生和老師，都在普遍地使用AI。前幾天去親戚家串門，他正在教育他閨女不要用AI寫作文了，一定要自己寫。結(jié)果她閨女特別委屈地方告訴他：這是老師讓的，老師說寫完之后，要傳給AI，讓AI給出修改意見。

前段時(shí)間，我去參加了一個(gè)大學(xué)教授和我們這些民間自媒體從業(yè)者的論壇，我特意問了關(guān)于使用AI的問題，答案是老師們也在普遍用AI做課件。

第二個(gè)故事，關(guān)于準(zhǔn)確性。

前段時(shí)間，良渚的自來水事件，鬧得沸沸揚(yáng)揚(yáng)，但是突然有個(gè)信息沖了出來，說農(nóng)夫山泉在良渚有工廠，一時(shí)間快速發(fā)酵，幸虧事件查的及時(shí)，發(fā)這個(gè)微博的博主很快刪除了信息，并且道了歉，說是AI上查到的信息，搞錯(cuò)了。一句搞錯(cuò)，差點(diǎn)給企業(yè)釀成大禍。

很顯然，AI在過去的兩年中，已經(jīng)證明了自己能夠給出比傳統(tǒng)搜索更優(yōu)質(zhì)答案的能力，人們也更愿意毫無底線地相信AI的答案，這種相信，在教授、媒體、教師、學(xué)術(shù)界、科學(xué)界、行政公務(wù)中都普遍存在，但是我們有沒有想過一個(gè)問題，如果AI在這些嚴(yán)肅學(xué)科領(lǐng)域，犯了良渚農(nóng)夫山泉那個(gè)錯(cuò)，帶來的后果會(huì)是什么？

我覺得就是蝴蝶效應(yīng)。

一個(gè)媒體報(bào)道，或者一篇論文，用錯(cuò)一個(gè)數(shù)據(jù)之后，會(huì)引發(fā)一連串的數(shù)據(jù)錯(cuò)誤復(fù)發(fā)，最終徹底讓AI陷入一種認(rèn)知錯(cuò)誤，誤導(dǎo)后面所有的人，這是一個(gè)多米諾的關(guān)系。

百度文心，最近弄了一個(gè)“放心寫”功能，大大提高了媒體和教育行業(yè)的AI使用確定性，我實(shí)話實(shí)說，之前為了確保數(shù)據(jù)不出錯(cuò)，我還是會(huì)對(duì)比幾個(gè)AI一起交叉驗(yàn)證，然后再配合權(quán)威媒體的報(bào)道，確保自己不出錯(cuò)，現(xiàn)在有了這個(gè)功能，直接把寫好的文章，傳給文心，有什么問題直接就會(huì)給我標(biāo)注出來，我在線就可以修改，二次再審。

這等于給每個(gè)寫作者，加了一道風(fēng)控，有沒有數(shù)據(jù)錯(cuò)誤，有沒有政策解讀錯(cuò)誤，有沒有論點(diǎn)論據(jù)錯(cuò)誤，我在內(nèi)部開玩笑，我們行業(yè)的校對(duì)可以徹底下崗了，的確，我們公司的校對(duì)下崗很久了。

為什么學(xué)術(shù)界、媒體界是AI最應(yīng)該關(guān)注的對(duì)象？因?yàn)锳I的很多數(shù)據(jù)來源要取自這里，如果這里出錯(cuò)，會(huì)交叉污染數(shù)據(jù)，所以百度文心現(xiàn)在用“放心寫”，堵住這個(gè)交叉污染的可能性，是抵制AI幻覺的一個(gè)非常有效的手段。

我也試用了一下，拿“最近汽車行業(yè)監(jiān)管政策解讀”這個(gè)問題生成了一篇文章，具體細(xì)節(jié)和最終成果我就不展開說了，只說結(jié)論：質(zhì)量很可用，以對(duì)話助手的方式，達(dá)到了我以前用某些大模型的智能體的水平。

這個(gè)檢驗(yàn)過程有意思，提示未通過部分，我專門查了一下，為什么AI判定「歐盟《新電池法》要求2027年動(dòng)力電池回收利用率達(dá)到95%」不通過？原來法案是針對(duì)不同材料的，確實(shí)不能一概而論，很嚴(yán)謹(jǐn)。

再次重寫后通過，下載分享也很絲滑。

還有一點(diǎn)要提示，記住要把左下角的“事實(shí)校對(duì)”打開。

近期還看到一條訊息，LMArena大模型競技場新發(fā)布了最新排名，文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜，排名中國第一，特別是在創(chuàng)意寫作等方面表現(xiàn)突出。

值得點(diǎn)贊，不管從模型上還是應(yīng)用上，文心在中文寫作方面都很強(qiáng)勁，目前在文心APP最新版本可以體驗(yàn)最新的模型能力了。我了解到，放心寫中文寫作準(zhǔn)確率已經(jīng)超過了99%，幻覺率大大降低。

總之，我覺得未來如果要確保AI不產(chǎn)生過多幻覺，“放心寫”還真是一條可行之路。

首先，數(shù)據(jù)庫如何建立？

既然是一個(gè)幫助用戶避免AI幻覺的寫作工具，那就是要有一個(gè)屬于自己的細(xì)分?jǐn)?shù)據(jù)庫，這個(gè)數(shù)據(jù)庫不是開放式的，“放心寫”采用的數(shù)據(jù)庫都是權(quán)威可信機(jī)構(gòu)媒體和政府官網(wǎng)，并沒有從海量的互聯(lián)網(wǎng)數(shù)據(jù)中去辨別，幻覺往往是因?yàn)殄e(cuò)誤信息權(quán)重大于正確信息之后，產(chǎn)生的結(jié)果。而且這種干擾，目前來看，是完全可實(shí)行的。

所以，用來二次辨別的工具，數(shù)據(jù)庫一定不是開放式全網(wǎng)數(shù)據(jù)。

其次，在小細(xì)分領(lǐng)域循環(huán)。

現(xiàn)在，文心“放心寫”對(duì)于公文、教育課件、行業(yè)報(bào)告、會(huì)議紀(jì)要等領(lǐng)域，已經(jīng)有強(qiáng)大的復(fù)盤能力，但是這種能力有個(gè)特性，就是服務(wù)辦公室工作比較多，并不是偏向娛樂和個(gè)人化需求，基本都是嚴(yán)肅話題，在這種特定場景中，數(shù)據(jù)就更容易保持干凈，這種干凈就可以傳染給外面的大數(shù)據(jù)庫。

第三，能夠幫助新手快速上手工作。

其實(shí)，對(duì)于很多辦公室新人，甚至新教師來說，如何規(guī)范自己的行文，規(guī)范自己的課件，是一件非常頭疼的事，因?yàn)檫@些東西，往往都有固定的格式，其實(shí)不需要太多個(gè)性化的東西，但是這個(gè)格式需要經(jīng)驗(yàn)，文心“放心寫”除了可以檢測錯(cuò)誤之外，也可以幫你根據(jù)你提供的參考文檔調(diào)整格式。

在過去的一年時(shí)間里，AI在很多公司，有了一個(gè)新名字，背鍋俠。

以前，公司里的人們辦公過程中出了錯(cuò)，會(huì)把鍋甩給供應(yīng)商，說是供應(yīng)商的錯(cuò)，但是現(xiàn)在大家發(fā)現(xiàn)，AI也可以承接這種錯(cuò)誤，這從側(cè)面也說明了一個(gè)問題，AI幻覺的確普遍性存在，是一個(gè)現(xiàn)實(shí)問題。

無數(shù)的專家在擔(dān)憂，我們社會(huì)未來的信息安全問題，人類在未來，到底還能不能真的分辨出哪些信息是真實(shí)的，哪些是AI杜撰出來的，今年良品鋪?zhàn)拥幕ㄉ�，被AI做出了一張花生長在樹上的圖，成了鬧劇，事實(shí)上，這種事情，以后這會(huì)越來越多。

百度這次做“放心寫”，算是從反方向做了一次嘗試，AI不僅僅可以是數(shù)據(jù)信息的提供者，也可以是數(shù)據(jù)信息的糾正者，幻覺可能是AI創(chuàng)造出來的，也可以是AI糾正的。

時(shí)間來到了2026年，AI的競爭很顯然會(huì)陷入一種白熱化，功能上的差異越來越小，那么下半場大家比什么？如果一個(gè)問題，所有AI給出的答案都大差不差，那么用誰都一樣。那么如果一個(gè)問題，有一個(gè)AI能夠給出不一樣的答案，并且能夠做到錯(cuò)誤率很低，或者不出錯(cuò)，這就是勝算。

確保自己和物理世界的強(qiáng)關(guān)聯(lián)，不出現(xiàn)幻覺，對(duì)自己的交付負(fù)責(zé)，這就是我心中AI后面的取勝法寶。

AI，在2026年，不能變成人們犯錯(cuò)的背鍋俠，而應(yīng)該是糾錯(cuò)俠。

原文標(biāo)題 : AI時(shí)代，蝴蝶和海嘯之間只隔一個(gè)錯(cuò)誤

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評(píng)論內(nèi)容...

請輸入評(píng)論/評(píng)論長度6~500個(gè)字

暫無評(píng)論

暫無評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

高級(jí)軟件工程師廣東省/深圳市
自動(dòng)化高級(jí)工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級(jí)銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网