123,123

^{<ins id="q7mcy"></ins>}

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

百度正式發(fā)布文心一言：比ChatGPT差一點，但可能更懂中文

2023-03-17 09:47

百度還沒準(zhǔn)備好，但還是發(fā)布了。

過去幾個月，ChatGPT 掀起的浪潮一刻也沒有停歇，包括國內(nèi)大量公司和科技從業(yè)者在興奮于 ChatGPT 出現(xiàn)的同時，也在期待中國自己的 ChatGPT。在所有宣稱將要推出類 ChatGPT 產(chǎn)品或大語言模型的公司中，百度是最早官宣的一批，也是第一個選擇正式發(fā)布的公司。

3 月 16 日，就在 GPT-4 重磅升級的兩天后，百度如期在北京總部正式發(fā)布了旗下大語言模型——文心一言。發(fā)布會現(xiàn)場，百度創(chuàng)始人兼李彥宏展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案、數(shù)理邏輯推算、中文理解和多模態(tài)生成五個方面的能力。

圖/百度

不過根據(jù)李彥宏的說法，由于生成式需要輸入較長的文本和時間，不適合在現(xiàn)場實機(jī)演示，故而選擇用錄屏形式展示文心一言的生成效果。坦白講，作為一場商業(yè)產(chǎn)品發(fā)布會，可以理解，畢竟一旦出錯將會極大影響外界的看法和股價，谷歌此前推出生成式 AI 聊天機(jī)器人 Bard 時就因為一個「答非所問」的錯誤：市值蒸發(fā)了上千億美元。

但也要承認(rèn)，錄屏的發(fā)布形式始終也讓這場產(chǎn)品發(fā)布會顯得有些空洞——誰也不知道錄屏背后會有多少次嘗試和人工痕跡，所以才有人調(diào)侃百度發(fā)布了 ChatPPT。反饋到股市上，文心一言不僅沒有抬升百度股價，甚至在發(fā)布后一度跌超 10%。

李彥宏在發(fā)布會上也提到，文心一言并不完美，但市場有需求就必須要推出來。然而并沒有準(zhǔn)備好的文心一言，是否選對發(fā)布時間和節(jié)奏，目前仍未可知。但盡管如此，還是能從這場發(fā)布會的內(nèi)容中一窺文心一言的面貌，以及百度的野心與困境。

文心一言距離 ChatGPT 有多遠(yuǎn)？

根據(jù)發(fā)布會上的視頻展示，文心一言面向大眾用戶的交互界面基本與 ChatGPT 類似，都以對話機(jī)器人形式回應(yīng)用戶的文本輸入。

圖/百度

但文心一言并沒有像兩天前發(fā)布的 GPT-4 一樣支持對圖片信息的總結(jié)和分析——讀圖、識圖，甚至懂梗圖，OpenAI 就將去年的一張梗圖輸入并附上文字要求 GPT-4 解釋笑點，結(jié)果 GPT-4 準(zhǔn)確地指出了「�！故恰笇⑦^時的巨大 VGA 接口插入現(xiàn)代的小巧智能手機(jī)的反差」。

圖/OpenAI

不同的是，文心一言支持了語音和視頻的輸出�！刚Z音」支持只是通過 TTS 語音合成技術(shù)以四川話讀出文本內(nèi)容，并不值得一提，但「視頻」生成的難度明顯更高。僅從錄屏展示來看，盡管模板痕跡明顯，但生成視頻（視頻素材+字幕）至少還是可堪一用。

而具體文本理解和生成能力上，百度在第一個「文學(xué)創(chuàng)作」環(huán)節(jié)展示了文心一言的續(xù)寫《三體》的創(chuàng)意能力，比如續(xù)寫可以從哪些角度出發(fā)：

圖/百度

這些回答本身不存在對錯，但如果我們對比下 ChatGPT 的回答，一定程度上能發(fā)現(xiàn)文心一言的文本輸出更「泛泛而談」，ChatGPT 的輸出會更加具體：

圖/ChatGPT

此外，百度在「商業(yè)文案」環(huán)節(jié)展示了如何用文心一言起公司名，我們也以同樣的問題詢問了 ChatGPT：

圖/百度

圖/ChatGPT

一個值得注意的問題是，如果不強(qiáng)調(diào)中文名，ChatGPT 會自然傾向使用英文名。

就像我們在之前的文章中提到的，OpenAI 在訓(xùn)練 GPT-3.5 和 GPT-4 大語言模型時的語料庫、基準(zhǔn)測試和開發(fā)人員都是以英文為主，所以 ChatGPT 在英文的理解和生成能力勝過包括中文在內(nèi)的其他語言。

這也是百度的優(yōu)勢所在。

百度可能更懂中文

盡管在整體能力上，很難期待百度一躍超過 ChatGPT 和 OpenAI，但百度文心一言相比 ChatGPT 在中文信息的可靠性上可能會有一定優(yōu)勢。除了上面提到的語言傾向問題，ChatGPT 不論是 GPT-3.5 還是 GPT-4 版本，訓(xùn)練用語料庫都截止于 2021 年 9 月，在涉及很多未知信息時容易編造內(nèi)容，比如在介紹電視劇《三體》演員陣容時再次「胡編亂造」：

圖/ChatGPT

相較之下，百度文心一言和微軟 Bing Chat 都正確指出了具體的演員陣容，Bing Chat 還提醒了我們另一個 Netflix 版本的電視劇《三體》。

發(fā)布會上，李彥宏表示，百度和文心一言更懂中文和中國市場，甚至單獨在五個環(huán)節(jié)中設(shè)置了「中文理解」的環(huán)節(jié)來展示。以百度官方演示的「洛陽紙貴」為例，ChatGPT 再次出現(xiàn)了「幻覺」，文心一言和 Bing Chat 基本指出了正確典故，但接下來只有文心一言正面回答了「當(dāng)時洛陽的紙到底有多貴」：

圖/百度

當(dāng)然，考慮百度選定的問題以及錄屏的形式，還很難就此斷定「文心一言在中文上比 ChatGPT（GPT-3.5）更強(qiáng)」，但可以肯定的是，「中文」的優(yōu)勢一定是百度乃至未來中國類 ChatGPT 產(chǎn)品發(fā)力的重中之重。

而同時百度也展示了自身在行業(yè)應(yīng)用上的優(yōu)勢。李彥宏引用百度在人工智能上的四層架構(gòu)——（AI）芯片層、（深度學(xué)習(xí)）框架層、模型層、應(yīng)用層時談到，百度的多層架構(gòu)協(xié)同效應(yīng)將推動 AI 實現(xiàn)更快的迭代速度，以及在應(yīng)用上也會有更高的效率和成本。

文心一言主要分為兩部分，一部分是面向普通用戶，通過嵌入百度搜索，用戶可以直接與文心一言大語言模型交互，預(yù)計類似微軟的 Bing 搜索和 Chat 的形式；另一部分面向企業(yè)客戶，提供上述提到的四層人工智能全棧能力，從底層的云計算能力到深度學(xué)習(xí)框架，再到大模型和應(yīng)用。

圖/百度

事實上，百度相比 OpenAI 更早開啟了 AI 大模型的商業(yè)化進(jìn)程，在百度文心大模型的官網(wǎng)就展示了與不同領(lǐng)域大公司合作開發(fā)的行業(yè)大模型，此外還宣布已經(jīng)有 650 家合作伙伴接入了文心一言，包括之前官宣的魅族、攜程、興業(yè)銀行、美通社等。

但最終百度還是在用戶側(cè)證明文心一言的表現(xiàn)實力，否則從合作伙伴到客戶到頭來只會放棄百度。

百度必須擁抱 ChatGPT

我們高估了 ChatGPT 的意義嗎？比爾·蓋茨將其比作互聯(lián)網(wǎng)的誕生，微軟 CEO 納德拉說它堪比工業(yè)革命，英偉達(dá) CEO 黃仁勛稱其為 AI 的「iPhone 時刻」。

我相信，但好像也無法篤定未來一定屬于類似 ChatGPT 的產(chǎn)品，不過可以肯定的是，ChatGPT 將改變搜索引擎的產(chǎn)品形態(tài)和業(yè)務(wù)模式。在這一點上，去年廣告收入（包括搜索廣告收入）占比分別為 60%和 77%的百度、谷歌都一樣，必須面對 ChatGPT 帶來的沖擊和變革。

另一方面，百度和谷歌在很早就率先擁抱了 AI 技術(shù)，并在長達(dá)十年的時間跨度上重金投入研發(fā)。百度在 2022 年將全年核心收入的 22.4%，即 214.16 億元投入了核心研發(fā)，而據(jù)歐盟委員會發(fā)布的報告，谷歌在 2022 年更是投入了 279 億歐元研發(fā)經(jīng)費，居全球第一。

但在 ChatGPT 之前，龐大的研發(fā)積累始終沒有找到合適的商業(yè)化出口，頗有些「英雄無用武之地」。

ChatGPT 帶來的突破確實帶來了出口，或者說風(fēng)口。當(dāng)用戶、開發(fā)者和企業(yè)客戶都在擁抱 ChatGPT，百度不可能放棄，就像李彥宏說的，文心一言沒有準(zhǔn)備好卻還是要發(fā)，是因為有市場需求。

題圖來自百度

來源：雷科技

原文標(biāo)題 : 百度正式發(fā)布文心一言：比ChatGPT差一點，但可能更懂中文

本地收藏打印推薦給朋友

聲明： 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載，目的在于信息傳遞，并不代表本站贊同其觀點和對其真實性負(fù)責(zé)，如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的，請聯(lián)系我們。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

4日10日
立即報名>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評選
4日10日
立即報名>> OFweek 2026（第十五屆）中國機(jī)器人產(chǎn)業(yè)大會
精彩回顧
立即查看>> 【線下會議】OFweek 2025（第十屆）物聯(lián)網(wǎng)產(chǎn)業(yè)大會
精彩回顧
立即查看>> 12月16-17日 AMD 嵌入式峰會
精彩回顧
立即查看>> 恩智浦創(chuàng)新技術(shù)峰會
精彩回顧
立即查看>> 【評選】維科杯·OFweek 2025（第十屆）物聯(lián)網(wǎng)行業(yè)年度評選

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標(biāo)題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网

<dl id="bt40w"><em id="bt40w"></em></dl>