123,123,123

當(dāng)前位置： OFweek 人工智能網(wǎng) > 其他 > 正文

CMMLU中文向排名第一！快手自研大模型來(lái)了

2023-08-22 09:12

來(lái)源： OFweek人工智能網(wǎng)

在國(guó)外微軟、谷歌和Meta因?yàn)锳I打得不可開(kāi)交的時(shí)候，國(guó)內(nèi)的互聯(lián)網(wǎng)公司們也開(kāi)始了新一輪的AI內(nèi)卷。

一開(kāi)始各家都想著自己要做出跟GPT一樣的大模型，比如百度、360等大廠(chǎng)。但是算力、算法、數(shù)據(jù)這三大項(xiàng)，在國(guó)內(nèi)的情況都心知肚明，根本和國(guó)外沒(méi)得比。

盡管百度的文心一言、訊飛的星火還有360的智腦等等大模型都陸續(xù)上線(xiàn)，但是最后的效果都不怎么盡如人意�？吹絿�(guó)內(nèi)首屈一指的頭部大廠(chǎng)都只能做成這樣，一下子讓不少公司回過(guò)味兒來(lái)，只要大模型能達(dá)到自己的需求就成，不去盲目拼什么參數(shù)和成績(jī)，拼也拼不過(guò)。

前段時(shí)間，字節(jié)跳動(dòng)代號(hào)為Grace的對(duì)話(huà)式AI項(xiàng)目，開(kāi)啟了內(nèi)測(cè)。最近，這個(gè)名叫Grace的項(xiàng)目，改叫“豆包”了。在一眾不是神仙就是神獸的AI面前，“豆包”倒顯得有點(diǎn)可愛(ài)捏～

盡管字節(jié)的負(fù)責(zé)人說(shuō)這個(gè)項(xiàng)目還不成熟，但是和抖音的結(jié)合還是值得期待。而另一邊的快手，似乎也等不及要秀秀肌肉了。

最近頻繁亮相的AI綜合中文評(píng)估基準(zhǔn)CMMLU等榜單上，一個(gè)KwaiYii－13B的模型成績(jī)相當(dāng)亮眼，更是一躍奪得CMMLU中文向排名第一！而這個(gè)KwaiYii－13B，就是來(lái)自快手的自研大模型“快意”（KwaiYii）。

CMMLU中文向排名第一！快手自研大模型來(lái)了

異軍突起的“快意”

在CMMLU榜單中，KwaiYii－13B同時(shí)位列five－shot和zero－shot項(xiàng)目下的中文向第一名，在人文學(xué)科、中國(guó)特定主題等方面較強(qiáng)，平均分超61分。

CMMLU中文向排名第一！快手自研大模型來(lái)了

根據(jù)GitHub的頁(yè)面顯示，“快意”是由快手 AI 團(tuán)隊(duì)研發(fā)的大規(guī)模語(yǔ)言模型，而本次引發(fā)關(guān)注的正是其新版本 KwaiYii－13B。

目前，快意覆蓋了預(yù)訓(xùn)練模型（KwaiYii－Base）、對(duì)話(huà)模型（KwaiYii－Chat），主要特點(diǎn)包括：

1、KwaiYii－13B－Base預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力，在絕大部分權(quán)威的中／英文Benchmark上取得了同等模型尺寸下的State－Of－The－Art效果。

例如，KwaiYii－13B－Base預(yù)訓(xùn)練模型在MMLU、CMMLU、C－Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領(lǐng)先水平。

CMMLU中文向排名第一！快手自研大模型來(lái)了

2、KwaiYii－13B－Chat對(duì)話(huà)模型具備出色的語(yǔ)言理解和生成能力，支持內(nèi)容創(chuàng)作、信息咨詢(xún)、數(shù)學(xué)邏輯、代碼編寫(xiě)、多輪對(duì)話(huà)等廣泛任務(wù)，人工評(píng)估結(jié)果表明KwaiYii－13B－Chat超過(guò)主流的開(kāi)源模型，并在內(nèi)容創(chuàng)作、信息咨詢(xún)和數(shù)學(xué)解題上接近ChatGPT（3．5）同等水平。

CMMLU中文向排名第一！快手自研大模型來(lái)了

據(jù)透露，快意目前已開(kāi)啟內(nèi)測(cè)，并為業(yè)務(wù)團(tuán)隊(duì)提供了標(biāo)準(zhǔn) API 和定制化項(xiàng)目合作方案。至于目的，明顯是沖著字節(jié)的“豆包”去的。

哭死，這回豆包真成干糧了！

快手不光有“快意”

7 月 8 日，快手宣布正在內(nèi)測(cè)智能問(wèn)答產(chǎn)品。8月8日，快手就宣布“快手AI對(duì)話(huà)”開(kāi)啟小范圍測(cè)試，而這倆其實(shí)都是基于“快意”大模型打造的對(duì)話(huà)式AI產(chǎn)品。

8 月 18 日，“快手AI對(duì)話(huà)”功能已經(jīng)在快手 APP 安卓版本開(kāi)放內(nèi)測(cè)，成為短視頻直播首個(gè)基于大語(yǔ)言模型落地的對(duì)話(huà)式AI產(chǎn)品。

在推出“快手AI對(duì)話(huà)”的時(shí)候，快手高級(jí)副總裁、研發(fā)線(xiàn)負(fù)責(zé)人于冰表示，AI大模型作為當(dāng)下最重要的革命性技術(shù)，進(jìn)入爆發(fā)期，有望開(kāi)啟AGI時(shí)代，而多模態(tài)內(nèi)容生成與理解是其核心能力。

至于為什么要投入到這場(chǎng)AI大潮中去，于冰也有著這個(gè)行業(yè)的共同看法。他覺(jué)得短視頻、直播作為最典型的多模態(tài)媒介，快手也應(yīng)該抓住平臺(tái)基因，在A(yíng)I大模型領(lǐng)域重度投入，全方位探索技術(shù)突破。

他介紹說(shuō)，目前，快手在A(yíng)I大模型的布局體系分為三個(gè)層級(jí)：基于具備高性能、高并發(fā)、高算力的“大基建”，構(gòu)建快手多模態(tài)的AI“大模型”，進(jìn)而在搜廣推、內(nèi)容創(chuàng)作、用戶(hù)增長(zhǎng)、研發(fā)效能等領(lǐng)域內(nèi)打造“大應(yīng)用”。

有了AI輔助，影視創(chuàng)作的成本會(huì)明顯地降低，周期也會(huì)縮短，這不管是對(duì)創(chuàng)作者來(lái)說(shuō)還是對(duì)平臺(tái)來(lái)說(shuō)，都是好事，能形成良性循環(huán)。

短視頻雙雄的AI賽跑

字節(jié)有“豆包”，快手有“快意”。目前來(lái)看沒(méi)有誰(shuí)比誰(shuí)強(qiáng)，只是側(cè)重點(diǎn)相對(duì)不同。

“豆包”其實(shí)只是字節(jié)對(duì)外公開(kāi)的AI對(duì)話(huà)大模型的一個(gè)模型而已，此外字節(jié)還提供“超愛(ài)聊天的小寧”“英語(yǔ)學(xué)習(xí)助手”“全能寫(xiě)作助手”三個(gè)不同的AI對(duì)話(huà)角色。

豆包大體上就和百度的文心一言一樣，問(wèn)答、續(xù)寫(xiě)、解析、推理等基礎(chǔ)功能都有，主要還是內(nèi)容生成服務(wù)。

CMMLU中文向排名第一！快手自研大模型來(lái)了

而快手AI對(duì)話(huà)的功能主要是為用戶(hù)提供快速、簡(jiǎn)便的查找功能，用戶(hù)可以通過(guò)對(duì)話(huà)的方式來(lái)快速查找自己感興趣的內(nèi)容，也可以通過(guò)對(duì)話(huà)的方式找到對(duì)應(yīng)的短視頻、達(dá)人或是其他內(nèi)容。

說(shuō)人話(huà)就是，“快手AI對(duì)話(huà)”其實(shí)更像Bingchat，更多的充當(dāng)一個(gè)搜索引擎，讓用戶(hù)去搜索快手內(nèi)容庫(kù)里的數(shù)據(jù)�？焓趾妥止�(jié)的差異主要在于算法優(yōu)化和數(shù)據(jù)訓(xùn)練規(guī)模，訓(xùn)練數(shù)據(jù)越多，其智能化程度就越高。

結(jié)語(yǔ)

短視頻平臺(tái)在走過(guò)AI算法推薦的路子之后，在生成式AI的加持下，到底能玩出什么花來(lái)呢？

而現(xiàn)在短視頻的同質(zhì)化會(huì)不會(huì)因?yàn)锳I的到來(lái)，有所改變，則是廣大用戶(hù)們更為關(guān)心的。

如果最后只是為了更方便直播帶貨，或者單純?yōu)榱俗寗?chuàng)作者更輕松，但不在乎質(zhì)量，那這個(gè)AI，還不如沒(méi)有。

本地收藏打印推薦給朋友

聲明： 本網(wǎng)站所刊載信息，不代表OFweek觀(guān)點(diǎn)�？帽菊靖寮�，務(wù)經(jīng)書(shū)面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像，違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

12月9日
立即報(bào)名>> 恩智浦創(chuàng)新技術(shù)峰會(huì)
【深圳專(zhuān)場(chǎng)】
立即報(bào)名 >> 12月16-17日 AMD 嵌入式峰會(huì)
12月19日
立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2025（第十屆）物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
精彩回顧
立即查看>> 【評(píng)選】維科杯·OFweek 2025（第十屆）物聯(lián)網(wǎng)行業(yè)年度評(píng)選
精彩回顧
立即查看>> 【白皮書(shū)】精準(zhǔn)洞察無(wú)線(xiàn)掌控——283FC智能自檢萬(wàn)用表
精彩回顧
立即查看>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

高級(jí)軟件工程師廣東省/深圳市
自動(dòng)化高級(jí)工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷(xiāo)售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級(jí)銷(xiāo)售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專(zhuān)家廣東省/江門(mén)市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网