訂閱
糾錯(cuò)
加入自媒體

年終盤點(diǎn):AI大模型今年有哪些變化?

2024年,大模型市場(chǎng)可謂熱鬧非凡,一方面,各大廠商紛紛將目光投向具體應(yīng)用場(chǎng)景,推動(dòng)行業(yè)定制化的大模型加速落地,這些模型正逐步滲透到金融、醫(yī)療、教育等多個(gè)關(guān)鍵行業(yè)中,為解決專業(yè)領(lǐng)域的復(fù)雜問題提供了方法。另一方面,關(guān)于大模型未來(lái)發(fā)展路徑的討論持續(xù)升溫,圍繞商業(yè)化落地、大模型與小模型的選擇、應(yīng)用的方向等成為業(yè)界關(guān)注的重點(diǎn)話題。

那么相比于2023年,2024年大模型行業(yè)發(fā)生了哪些變化呢?

01. 理念上:從月亮到六便士,市場(chǎng)越來(lái)越關(guān)注投資回報(bào)

2024年大模型行業(yè)的一大變化就是市場(chǎng)越來(lái)越務(wù)實(shí),越來(lái)越重視商業(yè)化落地程度。時(shí)間回到一年前,中國(guó)創(chuàng)投圈洋溢著久違的亢奮,從線上的媒體、社區(qū),到線下咖啡館,每個(gè)人都在談?wù)撝鳲penAI、大模型以及對(duì)未來(lái)AI世界的暢想。許多已功成名就、處于半隱退狀態(tài)的明星創(chuàng)業(yè)者,如李開復(fù)、王小川、王慧文等,也不甘心錯(cuò)過這次難得的技術(shù)浪潮,再次出山。

而現(xiàn)在這股亢奮的情緒開始退潮。不少投資人的耐心逐正在逐漸被消耗,與企業(yè)之間的關(guān)系產(chǎn)生了裂痕。今年11月,大模型明星創(chuàng)業(yè)公司“月之暗面”與前投資人“反目”,走到仲裁的事件在業(yè)內(nèi)引起廣泛關(guān)注。

根據(jù)桔子IT數(shù)據(jù),今年以來(lái)(1月1日~12月5日),國(guó)內(nèi)AI領(lǐng)域發(fā)生439起融資案例,總?cè)谫Y金額超564億元,大概是去年的80%。粗估來(lái)看,今年以來(lái)AI領(lǐng)域月均融資金額不到50億元。并且機(jī)構(gòu)縮減投資是普遍現(xiàn)象。據(jù)清科研究中心不完全統(tǒng)計(jì),今年上半年國(guó)內(nèi)對(duì)外投資活動(dòng)的早期投資、VC、PE機(jī)構(gòu)數(shù)量同比分別減少23.9%、19.2%、25.2%。

因此如果說(shuō)2023年,各家大模型廠商們都在專注于打磨模型參數(shù)、模型性能、榜單排名等各個(gè)方面的能力,爭(zhēng)相渴望成為“中國(guó)的OpenAI”,那么2024年,越來(lái)越多的人變得更加務(wù)實(shí),開始更關(guān)注落地場(chǎng)景和商業(yè)化。

尤其是進(jìn)入今年下半年,整個(gè)行業(yè)的風(fēng)向更加微妙。市場(chǎng)逐漸對(duì)大模型祛魅,資本也回歸理性,行業(yè)的兩股勢(shì)力也發(fā)生了站位的轉(zhuǎn)換。

一邊是阿里、字節(jié)等巨頭投入的動(dòng)作明顯加快,收編大模型創(chuàng)業(yè)公司的核心人才,推出一系列AI產(chǎn)品;一邊是創(chuàng)業(yè)公司開始重新評(píng)估自身的路線,國(guó)內(nèi)“AI六小虎”有兩家逐步放棄預(yù)訓(xùn)練模型,業(yè)務(wù)重心轉(zhuǎn)向AI應(yīng)用。

“AI大模型(賽道),將只剩下10家企業(yè)扮演重要角色。”中國(guó)工程院外籍院士張亞勤曾表示。這幾乎是行業(yè)的共識(shí),最后的勝利屬于少數(shù)的玩家。

大模型最終會(huì)進(jìn)化成什么樣,還不確定,但可以確定的是,大模型浪潮下,技術(shù)仍在迭代,場(chǎng)景仍在驚艷,商業(yè)化也始終在探索的路上。

02. 路線上:從堆算力到強(qiáng)化邏輯學(xué)習(xí),從大模型到小模型

2024年大模型行業(yè)的第二大變化就是技術(shù)路線上不再僅僅是堆算力,而是探索強(qiáng)化學(xué)習(xí)、知識(shí)計(jì)算、符號(hào)推理、類腦計(jì)算及其他新型路徑。其中投入更小,更垂直的小模型不斷涌現(xiàn)。

近年來(lái),大模型發(fā)展迅速,以其出色的性能,在語(yǔ)音識(shí)別、自然語(yǔ)言處理、圖像識(shí)別等多個(gè)領(lǐng)域取得了顯著成果。這些大模型通過深度學(xué)習(xí)技術(shù),能夠處理海量的數(shù)據(jù),并從中提取出有價(jià)值的特征和信息,為各種應(yīng)用場(chǎng)景提供強(qiáng)大的支持。特別是在金融、醫(yī)療、教育等行業(yè),大模型的應(yīng)用已經(jīng)逐漸深入到核心業(yè)務(wù)領(lǐng)域,成為推動(dòng)企業(yè)創(chuàng)新發(fā)展的重要?jiǎng)恿Α?/p>

然而,大模型的發(fā)展也面臨著一些挑戰(zhàn)。首先,大模型的訓(xùn)練和推理需要消耗大量的計(jì)算資源,這使得其成本高昂,且只有少數(shù)大型企業(yè)能夠承擔(dān)。其次,大模型在處理特定領(lǐng)域的問題時(shí),往往需要大量的數(shù)據(jù)進(jìn)行微調(diào),以適應(yīng)不同的應(yīng)用場(chǎng)景。此外,隨著大模型規(guī)模的不斷擴(kuò)大,其可解釋性和隱私保護(hù)問題也日益凸顯。

并且單純擴(kuò)大規(guī)模,存在幻覺、效率、可信、安全等瓶頸,現(xiàn)在讓一個(gè)大模型做一個(gè)奧數(shù)題和計(jì)算2+2這樣簡(jiǎn)單的算術(shù)題,需要的運(yùn)算量、運(yùn)算次數(shù)是一樣的。所以,我們能否把大模型做得更安全、更高效,更好解決現(xiàn)在存在的一些瓶頸?

需要指出的是本輪的AI浪潮,核心其實(shí)是LLM,即語(yǔ)言大模型——參數(shù)量數(shù)十億乃至上百億,需要專門的GPU集群,訓(xùn)練成本極高——真正能跑出來(lái)的產(chǎn)品,無(wú)一例外,都是用真金白銀堆砌起來(lái)的。

但AI顯然是要普及的,封閉、資本密集的大模型并不符合這樣的大趨勢(shì)。于是乎,開源的小模型成為了新的熱點(diǎn)——大模型的體量,使得它在手機(jī)、物聯(lián)網(wǎng)設(shè)備等小型終端上部署起來(lái)頗為麻煩,但小模型則不同。尤其是那些要求快速反應(yīng)的領(lǐng)域,比如語(yǔ)音和圖像的識(shí)別處理,小模型的處理效率也會(huì)更快——某種程度上說(shuō),小模型相當(dāng)于是大模型的精華版。

相較于大模型,小模型在特定場(chǎng)景下展現(xiàn)出了獨(dú)特的優(yōu)勢(shì)。一是小模型具有較低的計(jì)算復(fù)雜度和資源消耗,這使得其能夠在資源受限的環(huán)境下運(yùn)行,如移動(dòng)設(shè)備、邊緣計(jì)算節(jié)點(diǎn)等。二是小模型往往針對(duì)特定任務(wù)進(jìn)行優(yōu)化,因此在某些應(yīng)用場(chǎng)景下能夠取得與大模型相近甚至更好的性能。三是小模型的可解釋性較強(qiáng),更易于被用戶理解和接受。以openai的GPT-4o mini來(lái)說(shuō),成本下降的情況下,質(zhì)量反而更高,這就是數(shù)據(jù)集和訓(xùn)練方式改變后帶來(lái)的突破。

03. 應(yīng)用上:從對(duì)話到多元應(yīng)用,AI Agent、具身智能等涌現(xiàn)

2024年大模型行業(yè)的第三大變化就是應(yīng)用不斷迭代。根據(jù)lifearchitect.ai數(shù)據(jù),截至目前,全球總共有467個(gè)大模型。新技術(shù)不斷涌現(xiàn),行業(yè)競(jìng)速賽愈演愈烈,大模型廠商都在不斷迭代升級(jí),旨在離AGI更進(jìn)一步。進(jìn)入到今年,除了應(yīng)用上的百家爭(zhēng)鳴,一個(gè)明顯的變化在于,以ChatGPT為代表的大語(yǔ)言模型局限性日益顯現(xiàn)。

例如,他們只能處理文本領(lǐng)域的任務(wù),無(wú)法與物理和社會(huì)環(huán)境進(jìn)行互動(dòng);雖然大模型語(yǔ)料庫(kù)已經(jīng)十分豐富,但關(guān)于人類的價(jià)值觀的文本,他們并不具備理解能力。

在此前提下,OpenAI今年9月推出的o1系列模型重點(diǎn)在于會(huì)思考。彼時(shí),OpenAI CEO奧特曼對(duì)o1信心滿滿,“我認(rèn)為這次 o1 模型發(fā)布最重要的信息是,AI 發(fā)展不僅沒有放緩,而且我們對(duì)未來(lái)幾年已經(jīng)勝券在握。”

與GPT系列模型不同,o1系列模型有更強(qiáng)大的“思路鏈”,模型會(huì)在思考后回答用戶問題,輸出高質(zhì)量的內(nèi)容,而非迅速回應(yīng)無(wú)效回答。此外,o1系列更擅長(zhǎng)推理,推理能力大幅提升,特別是在奧數(shù)、編程等領(lǐng)域展現(xiàn)出了優(yōu)勢(shì)。

行業(yè)風(fēng)向標(biāo)的新動(dòng)作,引發(fā)國(guó)內(nèi)大模型廠商的追趕。11月16日,月之暗面公布了k0 math;11月20日,Deepseek上線DeepSeek-R1-Lite大模型;11月27日,昆侖萬(wàn)維推出“天工大模型 4.0” o1 版……無(wú)一不在強(qiáng)調(diào)大模型的邏輯思考能力。

與此同時(shí),到了今年下半年,幾乎人人都在談“AI Agent”(人工智能代理,也可稱為“智能體”)。在海外市場(chǎng),微軟、蘋果、谷歌、OpenAI、Anthropic等科技巨頭紛紛公布相關(guān)進(jìn)展;在國(guó)內(nèi)市場(chǎng),百度、阿里、騰訊、智譜、榮耀、聯(lián)想等一眾廠商的智能體平臺(tái)也紛至杳來(lái),一場(chǎng)圍繞“AI Agent”的爭(zhēng)奪戰(zhàn)正悄然開啟。

所謂“AI Agent”,OpenAI將“AI Agent”定義為以LLM為大腦驅(qū)動(dòng),具有自主理解、感知、規(guī)劃、記憶和使用工具的能力,能自動(dòng)化執(zhí)行復(fù)雜任務(wù)的系統(tǒng)。不同于傳統(tǒng)人工智能,AI Agent 具備通過獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。

舉個(gè)簡(jiǎn)單的例子,如果用戶想要進(jìn)行一次家庭聚餐,LLM可以為其提供就餐地點(diǎn)和店鋪相關(guān)信息提示,而AI Agent不僅能夠提供擇店鋪建議,還能基于用戶預(yù)算搜索菜系和店鋪,執(zhí)行預(yù)訂操作,并將行程添加到日歷,還可以發(fā)送行程提醒。

有觀點(diǎn)認(rèn)為,‌AI Agent的出現(xiàn)是為了解決LLM在具體應(yīng)用場(chǎng)景中的局限性。LLM雖然具備了一定的智能,能夠生成文本、圖片和視頻等內(nèi)容,但其功能相對(duì)有限,無(wú)法獨(dú)立完成復(fù)雜的任務(wù)。AI Agent作為大模型的上層應(yīng)用,能夠通過感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作,幫助大模型實(shí)現(xiàn)更多的功能,從而更好地為各行各業(yè)賦能。

此外具身智能也是大模型應(yīng)用的一大分支。所謂具身智能是指將人工智能(AI)融入機(jī)器人等物理實(shí)體,賦予它們具有像人類一樣的感知、學(xué)習(xí)和與環(huán)境動(dòng)態(tài)交互的能力。在生活中,可感知周邊環(huán)境的智能掃地機(jī)器人、已進(jìn)入路測(cè)的自動(dòng)駕駛汽車,都可被視為具身智能的雛形,而人形機(jī)器人則是具身智能最理想的載體。

以上種種,其實(shí)都可以視為行業(yè)在為大模型尋找最適合的“殺手級(jí)”應(yīng)用。

04. 結(jié)語(yǔ):朝著AGI的星辰大海,不斷前進(jìn)

綜上,無(wú)論是理念的變化,亦或是路線的選擇,還是應(yīng)用的迭代,最終的目的就是一個(gè)——走向AGI(通用人工智能)。

所謂AGI,即能夠執(zhí)行任何智能任務(wù)的人工智能,是人類智慧的延伸,也是未來(lái)科技的燈塔。它不僅僅是對(duì)特定任務(wù)的自動(dòng)化,而是對(duì)人類智能的全面模擬,包括學(xué)習(xí)、推理、規(guī)劃、感知、語(yǔ)言理解和創(chuàng)造力等。在這條道路上,我們正逐步攻克技術(shù)難題,從深度學(xué)習(xí)到神經(jīng)網(wǎng)絡(luò),從自然語(yǔ)言處理到機(jī)器視覺,每一次技術(shù)的突破都是朝著AGI目標(biāo)邁進(jìn)的一大步?茖W(xué)家們?cè)谒惴▋?yōu)化、數(shù)據(jù)集構(gòu)建、硬件加速等方面不懈努力,以期構(gòu)建出更加智能、更加靈活、更加接近人類思維的AI系統(tǒng)。

盡管挑戰(zhàn)重重,但人類對(duì)知識(shí)和智慧的追求從未停止。筆者相信,隨著技術(shù)的不斷進(jìn)步和人類智慧的不斷積累,AGI終將成為現(xiàn)實(shí)。它將幫助我們解決復(fù)雜的問題,提高生活質(zhì)量,甚至開啟人類文明的新篇章。而在這個(gè)過程中,我們不僅要追求技術(shù)的極致,更要思考如何讓技術(shù)更好地服務(wù)于人類,如何確保AGI的發(fā)展能夠促進(jìn)社會(huì)的公平與和諧。

       原文標(biāo)題 : 年終盤點(diǎn):AI大模型今年有哪些變化?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)