CMMLU中文向排名第一!快手自研大模型來了
在國外微軟、谷歌和Meta因為AI打得不可開交的時候,國內的互聯(lián)網公司們也開始了新一輪的AI內卷。
一開始各家都想著自己要做出跟GPT一樣的大模型,比如百度、360等大廠。但是算力、算法、數(shù)據這三大項,在國內的情況都心知肚明,根本和國外沒得比。
盡管百度的文心一言、訊飛的星火還有360的智腦等等大模型都陸續(xù)上線,但是最后的效果都不怎么盡如人意。看到國內首屈一指的頭部大廠都只能做成這樣,一下子讓不少公司回過味兒來,只要大模型能達到自己的需求就成,不去盲目拼什么參數(shù)和成績,拼也拼不過。
前段時間,字節(jié)跳動代號為Grace的對話式AI項目,開啟了內測。最近,這個名叫Grace的項目,改叫“豆包”了。在一眾不是神仙就是神獸的AI面前,“豆包”倒顯得有點可愛捏~
盡管字節(jié)的負責人說這個項目還不成熟,但是和抖音的結合還是值得期待。而另一邊的快手,似乎也等不及要秀秀肌肉了。
最近頻繁亮相的AI綜合中文評估基準CMMLU等榜單上,一個KwaiYii-13B的模型成績相當亮眼,更是一躍奪得CMMLU中文向排名第一!而這個KwaiYii-13B,就是來自快手的自研大模型“快意”(KwaiYii)。
異軍突起的“快意”
在CMMLU榜單中,KwaiYii-13B同時位列five-shot和zero-shot項目下的中文向第一名,在人文學科、中國特定主題等方面較強,平均分超61分。
根據GitHub的頁面顯示,“快意”是由快手 AI 團隊研發(fā)的大規(guī)模語言模型,而本次引發(fā)關注的正是其新版本 KwaiYii-13B。
目前,快意覆蓋了預訓練模型(KwaiYii-Base)、對話模型(KwaiYii-Chat),主要特點包括:
1、KwaiYii-13B-Base預訓練模型具備優(yōu)異的通用技術底座能力,在絕大部分權威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。
例如,KwaiYii-13B-Base預訓練模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領先水平。
2、KwaiYii-13B-Chat對話模型具備出色的語言理解和生成能力,支持內容創(chuàng)作、信息咨詢、數(shù)學邏輯、代碼編寫、多輪對話等廣泛任務,人工評估結果表明KwaiYii-13B-Chat超過主流的開源模型,并在內容創(chuàng)作、信息咨詢和數(shù)學解題上接近ChatGPT(3.5)同等水平。
據透露,快意目前已開啟內測,并為業(yè)務團隊提供了標準 API 和定制化項目合作方案。至于目的,明顯是沖著字節(jié)的“豆包”去的。
哭死,這回豆包真成干糧了!
快手不光有“快意”
7 月 8 日,快手宣布正在內測智能問答產品。8月8日,快手就宣布“快手AI對話”開啟小范圍測試,而這倆其實都是基于“快意”大模型打造的對話式AI產品。
8 月 18 日,“快手AI對話”功能已經在快手 APP 安卓版本開放內測,成為短視頻直播首個基于大語言模型落地的對話式AI產品。
在推出“快手AI對話”的時候,快手高級副總裁、研發(fā)線負責人于冰表示,AI大模型作為當下最重要的革命性技術,進入爆發(fā)期,有望開啟AGI時代,而多模態(tài)內容生成與理解是其核心能力。
至于為什么要投入到這場AI大潮中去,于冰也有著這個行業(yè)的共同看法。他覺得短視頻、直播作為最典型的多模態(tài)媒介,快手也應該抓住平臺基因,在AI大模型領域重度投入,全方位探索技術突破。
他介紹說,目前,快手在AI大模型的布局體系分為三個層級:基于具備高性能、高并發(fā)、高算力的“大基建”,構建快手多模態(tài)的AI“大模型”,進而在搜廣推、內容創(chuàng)作、用戶增長、研發(fā)效能等領域內打造“大應用”。
有了AI輔助,影視創(chuàng)作的成本會明顯地降低,周期也會縮短,這不管是對創(chuàng)作者來說還是對平臺來說,都是好事,能形成良性循環(huán)。
短視頻雙雄的AI賽跑
字節(jié)有“豆包”,快手有“快意”。目前來看沒有誰比誰強,只是側重點相對不同。
“豆包”其實只是字節(jié)對外公開的AI對話大模型的一個模型而已,此外字節(jié)還提供“超愛聊天的小寧”“英語學習助手”“全能寫作助手”三個不同的AI對話角色。
豆包大體上就和百度的文心一言一樣,問答、續(xù)寫、解析、推理等基礎功能都有,主要還是內容生成服務。
而快手AI對話的功能主要是為用戶提供快速、簡便的查找功能,用戶可以通過對話的方式來快速查找自己感興趣的內容,也可以通過對話的方式找到對應的短視頻、達人或是其他內容。
說人話就是,“快手AI對話”其實更像Bingchat,更多的充當一個搜索引擎,讓用戶去搜索快手內容庫里的數(shù)據?焓趾妥止(jié)的差異主要在于算法優(yōu)化和數(shù)據訓練規(guī)模,訓練數(shù)據越多,其智能化程度就越高。
結語
短視頻平臺在走過AI算法推薦的路子之后,在生成式AI的加持下,到底能玩出什么花來呢?
而現(xiàn)在短視頻的同質化會不會因為AI的到來,有所改變,則是廣大用戶們更為關心的。
如果最后只是為了更方便直播帶貨,或者單純?yōu)榱俗寗?chuàng)作者更輕松,但不在乎質量,那這個AI,還不如沒有。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?