123,123,123

<center id="24yuq"><acronym id="24yuq"></acronym></center>

<bdo id="24yuq"><source id="24yuq"></source></bdo><dl id="24yuq"><xmp id="24yuq"></xmp></dl>

<nav id="24yuq"></nav>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

實際上手文心一言4.0，真的媲美GPT-4了？

2023-10-31 14:29

尺有所短，寸有所長。

最近這段時間，大模型世界可以說是再度風(fēng)起云涌，不斷有大模型升級和涌現(xiàn)，作為國內(nèi)最早推出通用大模型的公司，百度也推出了文心大模型 4.0。

百度創(chuàng)始人、董事長兼 CEO 李彥宏當(dāng)場表示，文心 4.0 實現(xiàn)基礎(chǔ)模型的全面升級，在理解、生成、邏輯和記憶等能力上均有提升，「綜合水平與 GPT-4 相比已經(jīng)毫不遜色�！�

文心大模型 4.0 不是唯一一個對標(biāo) GPT-4 的大模型，中國有無數(shù)個大模型正在追趕 GPT-4，上周就有科大訊飛宣布星火大模型的下一次升級，就將全面對標(biāo) GPT-4。但話又說回來，文心大模型 4.0 真的能打了嗎？

終究還是得見真功夫。

眾所周知，百度在今年 3 月發(fā)布了國內(nèi)第一個大模型——文心大模型 3.5，并以此為基礎(chǔ)對話機器人文心一言，當(dāng)時雷科技就做了上手體驗，評價是還有很大的優(yōu)化空間，但也有不少驚喜。

所以我們干脆先看看過去半年時間，文心 4.0 到底能有多少進(jìn)步。

文心 3.5 的時候我們就問過如何評價《流浪地球 2》的問題，評價內(nèi)容水分較大，還提到了「星際戰(zhàn)斗場面」等錯誤信息，上映時間和演員信息上也出現(xiàn)了常見的錯誤。

微信截圖_20230317174846.png

公允地說，那個時候 ChatGPT 上也經(jīng)常遇到類似的問題，表現(xiàn)最好的可能還是聯(lián)網(wǎng)的 Bing Chat（GPT-4）。

到了文心 4.0 上，評價會相對更貼近實際內(nèi)容一些，盡管還是會出現(xiàn)探討「我們應(yīng)該如何保護地球」這種「胡話」，但追問上映時間和演員陣容都能給出準(zhǔn)確的信息。

此外，我們還問了一個常被用來「拷問」大模型的腦筋急轉(zhuǎn)彎，文心 3.5 的時候顯然還沒有理解人類：

微信截圖_20230317180424.png

但文心 4.0 不僅能從題目本身分析題意，還能將這個問題放到真實環(huán)境下進(jìn)行推理：

此外，文心 4.0 還能準(zhǔn)確明白近期的網(wǎng)絡(luò)熱梗和「中文十級難題」：

如果說前一個問題意味著文心 4.0 可以降維打擊所有「梗百科」產(chǎn)品，后一個問題則代表了文心 4.0 對中文的理解能力又上了一個新臺階，要知道，不少網(wǎng)友也是花了一段時間才真正看懂這個「幾等座」的問題。

更多的比較就不展示了，但顯然，文心 4.0 比起半年多前已經(jīng)聰明了不少，對中文的理解能力，聯(lián)網(wǎng)后對新信息的掌握以及邏輯推理能力都有明顯的提升。

但文心 4.0 還遠(yuǎn)不止于此。

既然大家都認(rèn)為 GPT-4 是目前最「聰明」的大模型，那我們自然也不能免俗拿 Bing Chat（GPT-4）和文心 4.0 進(jìn)行對比，比如先來一個比較簡單的「請假理由」。

文心一言給出的回答比較泛用，一般而言確實比較好用。

Bing Chat 則給出了更多的理由，比如腹瀉、家里斷水和身體不適也比較實用。

當(dāng)然，都到了「4.0」的階段，我們也嘗試提出一些比較高階且更具實際價值的挑戰(zhàn)。

第一個挑戰(zhàn)就是直接寫一份短視頻腳本，分別讓文心 4.0 和 Bing Chat 寫份關(guān)于廣州早餐的短視頻腳本。

Bing Chat 給出一份完成度相當(dāng)不錯，同時兼具創(chuàng)意和廣州特色的腳本，稍微補充修改是真的可以采用。

文心 4.0 創(chuàng)作的腳本就比較空泛，甚至把廣州替換成任意一座城市都不會影響內(nèi)容，更遑論「廣州特色」了。但如果多給一些提示，比如指出廣州的早茶、腸粉這些元素，文心 4.0 會進(jìn)一步完善腳本內(nèi)容，增加「廣州特色」的相關(guān)內(nèi)容。

但較真起來，顯然還是 Bing Chat 給出的腳本更具備實際價值，包括在畫面的細(xì)節(jié)描述上也更加豐富，更勝文心 4.0 一籌。

第二個挑戰(zhàn)則是創(chuàng)建網(wǎng)站教程，我們以比較簡單的樹洞網(wǎng)站為例，請教文心 4.0 和 Bing Chat。

但 Bing Chat 第一步就歇菜了，只是給出了一個樹洞網(wǎng)站及其功能的介紹，進(jìn)一步追問也只能「理解萬歲」，表示「我不能提供全部的代碼，因為這超出了我的能力范圍�！�

相比之下，當(dāng)我們要求文心 4.0 給出創(chuàng)建一個樹洞網(wǎng)站需要的全部代碼，可以看到它列出創(chuàng)建一個基本的樹洞網(wǎng)站需要的 HTML、CSS 和 JavaScript 代碼：

接下來進(jìn)一步請教如何在百度云上部署這些代碼，它也會先提供一些大概的步驟，比如注冊百度云賬號、創(chuàng)建實例、連接云服務(wù)器、上傳代碼等操作：

同時每一步還要繼續(xù)展開，比如連接云服務(wù)器的步驟：

誠然，現(xiàn)在大模型距離「用嘴」搭建網(wǎng)站、開發(fā) APP 還有很遠(yuǎn)的距離，但文心 4.0 確實展示了一些改變開發(fā)生態(tài)的能力，未來如果能夠與百度云打通，用文心一言貫穿整個流程，未必不能實現(xiàn)人人都可開發(fā)的未來。

不過大模型改變的不僅是內(nèi)容創(chuàng)作和代碼開發(fā)，還有翻譯。先簡單來一段英譯中：

稿定設(shè)計導(dǎo)出-20231030-192728.jpg

左：Bing Chat，右：文心 4.0

兩者的差別不是很大，只有在細(xì)節(jié)處理上有些微區(qū)別，但如果換成文言文風(fēng)格呢？

稿定設(shè)計導(dǎo)出-20231030-193124.jpg

下：Bing Chat，上：文心 4.0

相比 Bing Chat，文心 4.0 的翻譯更加準(zhǔn)確，沒有為了更精簡的文辭而略去了一些關(guān)鍵信息，就比如開頭第一句的「1985 年」。

如果我們在進(jìn)一步，要求它們將李白的《俠客行》翻譯成英文：

只能說，現(xiàn)如今的大模型還做不太到位。

另外，借助插件系統(tǒng)文心 4.0 還能做到 GPT-4 無法實現(xiàn)的一些功能，比如一鏡流影，即通過文字直接生成視頻內(nèi)容。需要解釋的是，這并非直接地文字生成視頻，而是通過 AI 生成文案、配音，再搭配實際拍攝畫面，最后再自動剪輯導(dǎo)出。

目前來看，這個功能還是有很多欠缺之處，生成視頻的質(zhì)量比較一般，又不能導(dǎo)入實際的制作流程，更多可能還是充當(dāng)創(chuàng)意發(fā)散和嘗鮮的價值。

盡管如此，文心 4.0 的表現(xiàn)已經(jīng)足夠讓我眼前一亮了，不僅在中文語義理解又有了一定的提升，在邏輯推理、知識問答方面也更多避免了大模型「幻覺」的出現(xiàn)�？梢哉f，文心 4.0 在綜合能力上確實與 GPT-4 不分上下。

題圖來自百度

來源：雷科技

原文標(biāo)題 : 實際上手文心一言4.0，真的媲美GPT-4了？

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

4日10日
立即報名>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
4日10日
立即報名>> OFweek 2026（第十五屆）中國機器人產(chǎn)業(yè)大會
精彩回顧
立即查看>> 【線下會議】OFweek 2025（第十屆）物聯(lián)網(wǎng)產(chǎn)業(yè)大會
精彩回顧
立即查看>> 12月16-17日 AMD 嵌入式峰會
精彩回顧
立即查看>> 恩智浦創(chuàng)新技術(shù)峰會
精彩回顧
立即查看>> 【評選】維科杯·OFweek 2025（第十屆）物聯(lián)網(wǎng)行業(yè)年度評選

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標(biāo)題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网

<bdo id="mic44"><strong id="mic44"></strong></bdo>