訂閱
糾錯(cuò)
加入自媒體

GPT-4.5發(fā)布,號(hào)稱OpenAI最好的聊天模型

前言:GPT-4.5的發(fā)布被OpenAI視為[非思維鏈模型的最后一代],此后將轉(zhuǎn)向需要長(zhǎng)時(shí)間思考的推理模型。

這一轉(zhuǎn)變與行業(yè)趨勢(shì)緊密相連——自從DeepSeekR1開(kāi)源引發(fā)推理熱潮后,AI競(jìng)爭(zhēng)的焦點(diǎn)已經(jīng)從數(shù)據(jù)規(guī)模轉(zhuǎn)向邏輯深度。

作者| 方文三圖片來(lái)源|網(wǎng) 絡(luò)

OpenAI正式發(fā)布GPT-4.5

在2月27日,OpenAI通過(guò)一段時(shí)長(zhǎng)為13分鐘的視頻,正式發(fā)布了其迄今為止最為龐大的最新模型——GPT-4.5。

在介紹該模型時(shí),OpenAI的研究副總裁MiaGlaese指出,GPT-4.5模型的顯著特點(diǎn)是其能夠進(jìn)行充滿熱情、直觀且自然流暢的對(duì)話,并且在理解用戶需求方面展現(xiàn)出更為強(qiáng)大的能力。

GPT-4.5與o1在回答同一問(wèn)題時(shí)的表現(xiàn)有所不同。

值得注意的是,GPT-4.5并非一個(gè)推理模型,而是迄今為止OpenAI所構(gòu)建的規(guī)模最大、知識(shí)儲(chǔ)備最為豐富的模型。

據(jù)透露,GPT-4.5的訓(xùn)練過(guò)程消耗了相當(dāng)于GPT-4o十倍的計(jì)算資源,其性能的提升充分展示了預(yù)訓(xùn)練規(guī)模擴(kuò)展所帶來(lái)的顯著效果。

在多項(xiàng)基準(zhǔn)測(cè)試中,GPT-4.5的表現(xiàn)超越了GPT-4o,特別是在數(shù)學(xué)能力上提高了27%,在編碼能力上提升了7%至10%。GPT-4.5在某些特定指標(biāo)上甚至超越了o3-mini。

GPT-4.5的核心進(jìn)步體現(xiàn)在無(wú)監(jiān)督學(xué)習(xí)能力的增強(qiáng)。

通過(guò)增強(qiáng)計(jì)算資源和數(shù)據(jù)規(guī)模,該模型在執(zhí)行復(fù)雜任務(wù)時(shí)表現(xiàn)出更高的精確度,特別是在降低[幻覺(jué)]現(xiàn)象(即錯(cuò)誤生成信息)方面取得了顯著成效。

這使得GPT-4.5在處理事實(shí)性問(wèn)題時(shí)更為可靠,適用范圍也更為廣泛。

在減少幻覺(jué)和提高準(zhǔn)確率方面,早期測(cè)試顯示GPT-4.5具有較高的情感智能(EQ),能夠根據(jù)對(duì)話情境調(diào)整其回應(yīng),尤其在處理與用戶情感相關(guān)的交流時(shí),展現(xiàn)了較高的同理心。

盡管其更高的[情商]、審美直覺(jué)和創(chuàng)造力主要依賴于無(wú)監(jiān)督學(xué)習(xí),GPT-4.5在推理能力方面也顯示出強(qiáng)勁的實(shí)力。

GPT-4.5的顯著升級(jí)體現(xiàn)在其對(duì)人類情感的深刻理解。

OpenAI的研究副總裁MiaGlaese強(qiáng)調(diào),GPT-4.5的回應(yīng)更加溫馨、自然,并且能夠通過(guò)語(yǔ)言調(diào)整用戶的情緒狀態(tài)。

更通用和更自然智能的模型

OpenAI明確指出,GPT-4.5在作出反應(yīng)之前并不進(jìn)行思考,這使得其優(yōu)勢(shì)與推理模型如o1等截然不同。

因此,與o1、o3-mini相比,GPT-4.5被認(rèn)為是一種更通用、更自然智能的模型。

OpenAI堅(jiān)信推理將成為未來(lái)模型的核心能力,而預(yù)訓(xùn)練和推理這兩種擴(kuò)展方法將相互補(bǔ)充。

隨著GPT-4.5等模型通過(guò)預(yù)訓(xùn)練變得更加智能和知識(shí)淵博,它們將成為推理和使用工具的代理的更強(qiáng)大的基礎(chǔ)。

在GPQA(科學(xué))、AIME’24(數(shù)學(xué))、SWE-BenchVerfied(編碼)等數(shù)據(jù)集上,GPT-4.5全面領(lǐng)先于GPT-4o,但在數(shù)學(xué)和真實(shí)編程能力方面,仍略遜于o3-mini。

OpenAI已經(jīng)開(kāi)發(fā)出一系列先進(jìn)的可擴(kuò)展技術(shù),這些技術(shù)使得GPT-4.5能夠利用較小模型的數(shù)據(jù)集來(lái)訓(xùn)練更為龐大和強(qiáng)大的模型。

這些技術(shù)的引入顯著提升了GPT-4.5的操作性、對(duì)細(xì)節(jié)的敏感度以及自然對(duì)話能力。

定價(jià)高于市面主力大模型

目前,GPT-4.5僅對(duì)ChatGPTPro用戶開(kāi)放,其訂閱費(fèi)用高達(dá)每月200美元,API使用成本則為輸入75美元/百萬(wàn)token、輸出150美元/百萬(wàn)token,是GPT-4o的30倍。

OpenAI坦承,模型訓(xùn)練消耗了大量GPU資源,因此迫切需要擴(kuò)充數(shù)萬(wàn)張顯卡以滿足需求。

以輸入數(shù)據(jù)緩存未命中為例,GPT-4.5的API費(fèi)用是GPT-4o的三十倍,較之DeepSeek-V3(美元定價(jià))則為二百七十七倍,與DeepSeek-R1(美元定價(jià))相比則為一百三十六倍。

進(jìn)一步比較,即便是在DeepSeek的優(yōu)惠時(shí)段,GPT-4.5的費(fèi)用也達(dá)到了前者的五百五十五倍。

GPT-4.5的API定價(jià)出乎意料地高,不僅高于自家主力大模型,甚至比新推出的全球首個(gè)混合推理模型Claude-3.7-Sonnet高出二十五倍,更不用說(shuō)與剛剛宣布錯(cuò)峰定價(jià)的[價(jià)格屠夫]DeepSeek相比了。

GPT-4.5的計(jì)算效率相較于GPT-4實(shí)現(xiàn)了超過(guò)十倍的提升。

在API層面,ChatCompletionsAPI、AssistantsAPI和BatchAPI將向所有付費(fèi)開(kāi)發(fā)者提供預(yù)覽,支持函數(shù)調(diào)用等關(guān)鍵功能及圖像輸入視覺(jué)功能,適用于寫作輔助等應(yīng)用場(chǎng)景。

然而,由于模型龐大且計(jì)算密集,成本較高,官方正在評(píng)估是否長(zhǎng)期在API中提供該服務(wù)。

將與kimi、DeepSeek展開(kāi)競(jìng)爭(zhēng)

目前,OpenAI的市值已超過(guò)1570億美元(約合人民幣1.1萬(wàn)億元)。

最近,奧爾特曼公開(kāi)透露,OpenAI正在考慮根據(jù)使用量來(lái)設(shè)定價(jià)格策略。

至于何時(shí)能夠?qū)崿F(xiàn)通用人工智能(AGI),他指出,當(dāng)一個(gè)AI系統(tǒng)能夠執(zhí)行一個(gè)熟練人士在關(guān)鍵工作中所能完成的任務(wù)時(shí),即可稱之為AGI。

值得注意的是,在今天凌晨,月之暗面kimi再次發(fā)布最版本的Kimi-K1.6-IOI-high模型,該模型在LiveCodeBench基準(zhǔn)測(cè)試中排名第一,超越了GPT和Claude系列模型。

同時(shí),DeepSeek的開(kāi)源周活動(dòng)持續(xù)吸引公眾關(guān)注,包括發(fā)布了專為英偉達(dá)HopperGPU設(shè)計(jì)的MLA解碼內(nèi)核FlashMLA、EP通信庫(kù)DeepEP、FP8GEMM(通用矩陣乘法)計(jì)算庫(kù)DeepGEMM等。

據(jù)公開(kāi)資料,2024年全年,OpenAI的銷售收入約為37億美元,同比增長(zhǎng)超過(guò)1700%。

預(yù)計(jì)到2025年,OpenAI的年化收入將增長(zhǎng)至116億美元,其中75%的收入來(lái)源于用戶對(duì)ChatGPTPlus服務(wù)的訂閱。

內(nèi)部預(yù)估,到2029年全年,OpenAI的營(yíng)收將達(dá)到1000億美元,相當(dāng)于目前雀巢公司的年銷售額。

GPT-4.5象征著一個(gè)時(shí)代的終結(jié)

OpenAI宣布,GPT-4.5將是其聊天機(jī)器人系統(tǒng)中最后一個(gè)不包含[思維鏈推理]功能的版本。

繼GPT-4.5之后,OpenAI的模型將可能模仿人類的思考方式,花費(fèi)更多時(shí)間深入思考問(wèn)題后再給出回答,而不是立即作出反應(yīng)。

GPT-4.5代表了OpenAI最后一個(gè)[非思維鏈]模型。

基于GPT-4.5,OpenAI計(jì)劃優(yōu)化其產(chǎn)品線,為GPT-5的重大創(chuàng)新做好準(zhǔn)備,并奠定采用新方法的基礎(chǔ)。

山姆·奧特曼指出,過(guò)多的模型會(huì)使用戶感到困惑,而未來(lái)的GPT-5將成為一個(gè)重要里程碑,它將整合OpenAI的所有技術(shù)進(jìn)步。

其中最大的創(chuàng)新在于它與之前獨(dú)立的o系列模型的融合。

OpenAI表示,它將把o3模型中的大部分技術(shù)整合進(jìn)GPT-5,這實(shí)際上意味著o3模型將不再作為一個(gè)獨(dú)立的產(chǎn)品存在。

換言之,GPT-5將融合兩個(gè)并行發(fā)展的[AI大腦]的優(yōu)勢(shì)。

業(yè)界推測(cè),GPT-5可能會(huì)扮演[路由器模型]的角色,根據(jù)需要協(xié)調(diào)各種內(nèi)部組件或子模型。

用戶只需與GPT-5交互,而GPT-5將利用不同的工具和知識(shí)資源來(lái)尋找最佳解決方案,這可能包括訪問(wèn)搜索引擎、執(zhí)行計(jì)算或使用代碼解釋工具,具體取決于任務(wù)需求。

結(jié)尾:在收購(gòu)OpenAI未果后計(jì)劃

GPT-4.5的發(fā)布不僅是技術(shù)上的進(jìn)步,更是AI人性化的重要里程碑。

它用情商重新定義了人機(jī)交互,用知識(shí)的廣度賦能實(shí)際應(yīng)用場(chǎng)景,同時(shí)也因高昂的成本引發(fā)了爭(zhēng)議。

隨著推理模型的到來(lái),AI有望真正融入人類生活,成為工作與情感的[雙重助手]。

對(duì)于普通用戶而言,如何在性能與成本之間找到平衡,將是接下來(lái)最實(shí)際的挑戰(zhàn)。

部分資料參考:鳳凰網(wǎng)科技:《史上最貴AI模型上線,主打情商高,奧特曼竟因"帶娃"缺席發(fā)布會(huì)?》,網(wǎng)站知識(shí):《OpenAI發(fā)布GPT-4.5:高情商AI引發(fā)全網(wǎng)熱議》,機(jī)器之心:《OpenAI迄今最大、最貴模型,API價(jià)格飛漲30倍,不拼推理拼情商》,DeepTech深科技:《OpenAI發(fā)布號(hào)稱[情商最高]的AI模型,奧特曼稱GPU已用完》,雷科技:《價(jià)格是DeepSeek277倍!GPT-4.5還是太自信了》,鈦媒體AGI:《6年來(lái)最強(qiáng)模型GPT-4.5登場(chǎng):更貴、更高情商、更少幻覺(jué)》

       原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨GPT-4.5正式發(fā)布,號(hào)稱OpenAI最好的聊天模型

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)