訂閱
糾錯
加入自媒體

10億用戶目標落空背后:OpenAI的組織、產(chǎn)品問題如何損害ChatGPT?丨T insights

ChatGPT撞上“技術(shù)進步≠用戶體驗”的墻。

過去一年間,部分OpenAI員工注意到,用戶對ChatGPT改進的反應(yīng)令人擔(dān)憂。

往年,每當驅(qū)動ChatGPT的AI進行重大升級時,用戶量都會激增——因為使用體驗更好。

然而今年,盡管ChatGPT吸引了更多用戶,但底層AI模型智能和能力的提升似乎對大多數(shù)用戶毫無影響。

這一趨勢令員工們困惑不已。

公司研究團隊耗時數(shù)月開發(fā)的新推理模型,在解答數(shù)學(xué)、科學(xué)等復(fù)雜問題時耗時遠超ChatGPT前代模型。

OpenAI曾宣稱其AI今年夏季在2025年國際數(shù)學(xué)奧林匹克競賽中展現(xiàn)了金牌級水準,秋季又在2025年國際大學(xué)生程序設(shè)計競賽中拔得頭籌。

但用戶使用ChatGPT時,大多未能體現(xiàn)這些技術(shù)進步的價值。

AI評估初創(chuàng)公司LMArena的AI能力主管彼得·戈斯泰夫指出,OpenAI專注于科學(xué)、數(shù)學(xué)、編程等領(lǐng)域,但“似乎與ChatGPT目標用戶的需求并不匹配” 。

多數(shù)情況下,ChatGPT用戶“可能只是詢問電影評分這類簡單問題,根本不需要模型耗費半小時思考”。

OpenAI九月發(fā)布的ChatGPT查詢數(shù)據(jù)似乎印證了戈斯蒂夫的觀點。

這一問題及其它OpenAI底層技術(shù)與產(chǎn)品間的脫節(jié),為谷歌等競爭對手創(chuàng)造了超越ChatGPT的機會。

因此OpenAI CEO山姆·阿爾特曼本月初發(fā)布“紅色警報”,要求公司重新聚焦ChatGPT改進,以吸引更多用戶。

繁榮下的隱患

用戶對ChatGPT更新的反應(yīng)變化表明:OpenAI核心AI技術(shù)開發(fā)部門的目標,未必能滿足ChatGPT的需求——盡管其貢獻了公司大部分營收。

這也表明,隨著谷歌等競爭對手的AI產(chǎn)品功能日益豐富,OpenAI對ChatGPT的營收依賴可能成為其軟肋。

目前,關(guān)于ChatGPT是否會擊垮谷歌搜索,部分人的觀點與一兩年前相比已發(fā)生了轉(zhuǎn)變:

當時OpenAI和谷歌高管都認為ChatGPT可能會取代主流搜索引擎。(OpenAI發(fā)言人稱ChatGPT全球助手使用率約占70%,榮登蘋果年度免費下載榜首,在不到三年時間內(nèi)占據(jù)10%的搜索市場份額。)

此后谷歌在搜索結(jié)果頂部添加了AI智能解答,并宣稱這正“顯著”推動搜索查詢量增長和營收提升,因為用戶“逐漸認識到谷歌能解答更多問題”。

OpenAI此次重啟ChatGPT推廣,但其雄心勃勃的用戶增長目標面臨著落空風(fēng)險:

今年初OpenAI周活躍用戶達3.5億時,曾宣稱今年要突破10億大關(guān),但截至本月初周活躍用戶不足9億,該目標恐難實現(xiàn)。

不過,OpenAI在說服更多個人工作者和企業(yè)訂閱ChatGPT以獲取額外功能和無限制使用方面,表現(xiàn)令人矚目。

該公司目前年化營收已突破190億美元(主要來自此類訂閱),較今年1月的60億美元大幅增長。

這表明其有望實現(xiàn)今年8月設(shè)定的目標:年底前達成200億美元年化營收。

image.png

ChatGPT收費模式:每百名周活躍用戶中,約五人付費使用Pro或Plus服務(wù)。(注:現(xiàn)有數(shù)據(jù)。虛線表示新功能。數(shù)據(jù)來源:《The Information》)

OpenAI還有望提前實現(xiàn)2025年130億美元的營收目標(去年約為40億美元),并計劃以7500億美元估值融資(比兩個月前股權(quán)融資時的估值高出50%)。

按大多數(shù)標準衡量,這些數(shù)字都堪稱驚人且令人艷羨。

但要實現(xiàn)其預(yù)期的2030年2000億美元營收目標,OpenAI可能需要想辦法將周活躍用戶轉(zhuǎn)化為日活躍用戶。

因為這樣才能增加投放廣告的機會,或從ChatGPT促成的產(chǎn)品銷售中抽成。

文本界面的局限

想要達成目標,OpenAI需要解決其組織架構(gòu)和產(chǎn)品層面的挑戰(zhàn)。

據(jù)悉,OpenAI研究部門(有超千名成員,基本與公司其他部門隔離)今年主要專注于開發(fā)推理模型,而非專門改進ChatGPT。

但知情人透露,推理模型對ChatGPT作用有限,因為用戶普遍追求快速獲得答案。

推理模型回答問題往往耗時數(shù)秒至數(shù)分鐘,這對習(xí)慣谷歌即時搜索結(jié)果的用戶而言堪稱漫長。

OpenAI表示,推理模型更適合完成復(fù)雜的多步驟任務(wù)、審查海量代碼或從企業(yè)文檔庫中檢索特定信息。

ChatGPT面臨的困境遠不止推理模型問題:用戶似乎沒能充分理解其能解答的知識邊界——這限制了用戶的使用時長。

尤其是ChatGPT基于文本的設(shè)計使用戶難以發(fā)現(xiàn)其非文本功能,例如分析機械或計算機錯誤圖像并提供修復(fù)建議的能力。

ChatGPT產(chǎn)品主管尼克·特利指出,當前界面類似于1980年代微軟推出的PC純文本操作系統(tǒng)MS-DOS。(直到微軟推出更具視覺吸引力且直觀的Windows操作系統(tǒng)后,PC革命才真正起飛。)

OpenAI其他高管也表達了類似觀點,認為ChatGPT必須改變界面設(shè)計才能贏得更多青睞。

OpenAI應(yīng)用負責(zé)人菲吉·西莫透露,ChatGPT正“從以文本對話為主,向基于用戶操作需求動態(tài)生成組件的完整生成式界面轉(zhuǎn)型”。

上周OpenAI為ChatGPT用戶推出了全新圖像生成模型,并宣布將增強文本回復(fù)中的視覺元素。

產(chǎn)品并非終極目標

但負責(zé)ChatGPT等應(yīng)用的西莫(數(shù)月前從Instacart加入OpenAI)似乎深知公司內(nèi)部的局限性。她近期在博客中寫道,OpenAI本質(zhì)上仍是專注研究的公司,“產(chǎn)品本身并非目標”。

與OpenAI(核心產(chǎn)品主要面向消費者)不同,其部分競爭對手并未出現(xiàn)研究與產(chǎn)品脫節(jié)的現(xiàn)象。

例如Anthropic主要將研發(fā)資源投入面向企業(yè)的應(yīng)用程序接口(API)。目前該公司的模型越智能(尤其在生成計算機代碼方面),其面向其他企業(yè)和應(yīng)用開發(fā)者的API銷售額就越高。

在OpenAI,模型改進同樣能推動API銷售,但其營收僅占當前及預(yù)期總營收的極小部分。

據(jù)悉,今年大部分時間里,阿爾特曼似乎以O(shè)penAI已征服聊天機器人市場的姿態(tài)運營公司:他啟動了非常多其他產(chǎn)品項目,包括Sora視頻應(yīng)用、音樂生成AI、網(wǎng)頁瀏覽器、專用AI代理、消費級硬件設(shè)備、機器人等。

多位OpenAI研究人員指出,這些項目分散了提升ChatGPT大眾吸引力的資源。

近期,OpenAI管理層已日益意識到ChatGPT可能面臨風(fēng)險,這令許多人感到不安。阿爾特曼在發(fā)布“紅色警報”時表示,計劃讓部分員工回歸ChatGPT研發(fā)。

OpenAI發(fā)言人表示:“產(chǎn)品與研究深度互聯(lián)而非對立。研究突破塑造產(chǎn)品,產(chǎn)品反饋反哺研究。這是構(gòu)建并安全部署日益強大模型的統(tǒng)一戰(zhàn)略,而非對立陣營的割裂。”

推理模型的局限

過去一年間,OpenAI研究團隊與ChatGPT產(chǎn)品團隊的分歧逐漸顯現(xiàn)。

公司此前采用的傳統(tǒng)訓(xùn)練方法在改進大語言模型方面成效不佳,因此將重心轉(zhuǎn)向推理模型,以期最終實現(xiàn)具備或超越人類能力的通用AI。

最初研究人員認為推理模型也能提升ChatGPT性能,但今年初,當OpenAI將其最先進的推理模型轉(zhuǎn)換為ChatGPT可用版本時,模型性能反而下降。

事實證明,將模型改造成聊天版本意外削弱了其智能水平。

最終OpenAI仍設(shè)法將推理模型引入了ChatGPT。目前這些模型為ChatGPT的“思考模式”和“深度研究”智能體(今年2月推出,能生成報告),以及OpenAI的編程助手應(yīng)用Codex提供支持。

但事實上,在ChatGPT近9億的周活躍用戶中,定期使用這些功能的用戶比例極低。

OpenAI內(nèi)部研究人員指出,推理模型能否推動通用人工智能(AGI)發(fā)展仍存在巨大不確定性。

OpenAI近期對ChatGPT的調(diào)整暗示推理模型正成為ChatGPT的負擔(dān)。(本月早些時候OpenAI悄然撤銷了免費及最低價ChatGPT訂閱層級中自動將用戶問題轉(zhuǎn)至推理模型的功能。)

OpenAI在為ChatGPT引入改進模型時還面臨其他障礙:即便是非推理AI模型也可能與ChatGPT功能產(chǎn)生沖突。

據(jù)悉,發(fā)布旗艦級大語言模型GPT-5(為OpenAI產(chǎn)品提供支持)前的數(shù)周內(nèi),研究人員發(fā)現(xiàn)該模型在編程等特定任務(wù)上的表現(xiàn),在集成至聊天機器人后反而下降。

這是因為當用戶向ChatGPT發(fā)送查詢時,它會結(jié)合自身掌握的用戶信息(如職業(yè))來個性化回答。然而,這些個人信息有時會干擾模型對用戶提問的理解,導(dǎo)致回答錯誤。

雖然公司在發(fā)布GPT-5前修復(fù)了該問題,但部分員工認為新模型與ChatGPT功能間的干擾仍將持續(xù)存在。

谷歌的反擊

OpenAI內(nèi)部研究與產(chǎn)品部門的裂痕另有跡象。

據(jù)悉,今年OpenAI降低了圖像生成模型的開發(fā)優(yōu)先級(該模型曾在3月短暫提升了ChatGPT的使用量和用戶數(shù))。

雖無法得知決策緣由,但當谷歌8月推出廣受好評的圖像生成AI “Nano Banana”后,OpenAI高管緊急決定提升圖像技術(shù)。

這引發(fā)了阿爾特曼與研究主管馬克·陳的分歧:前者認為圖像生成能力對ChatGPT發(fā)展至關(guān)重要,后者則主張優(yōu)先推進其他項目。

image.png

谷歌Nano Banana生成的圖像

本月初阿爾特曼在“紅色警報”中強調(diào)圖像生成將是優(yōu)化ChatGPT的核心方向,上周OpenAI為ChatGPT發(fā)布了全新圖像生成模型。

作為OpenAI的競爭對手,谷歌能通過搜索引擎、Chrome瀏覽器及Gmail等辦公應(yīng)用讓AI觸達用戶,在AI普及方面占據(jù)優(yōu)勢。

近期谷歌的AI模型已顯著提升,在圖像生成和計算機代碼編寫等能力上基本與ChatGPT持平,使得谷歌的Gemini及其他AI產(chǎn)品更具吸引力。

這使OpenAI領(lǐng)導(dǎo)層擔(dān)憂普通用戶難以辨別ChatGPT與谷歌Gemini的差異:與Facebook、Instagram等社交應(yīng)用不同,聊天機器人通常不具備網(wǎng)絡(luò)效應(yīng)。

OpenAI還面臨另一重劣勢:財務(wù)狀況。

為訓(xùn)練和運行包括ChatGPT在內(nèi)的AI,OpenAI正以每年數(shù)十億美元的速度消耗現(xiàn)金,不斷租賃更多服務(wù)器。

盡管OpenAI正著力開發(fā)自有數(shù)據(jù)中心和服務(wù)器芯片以降低長期成本,但谷歌憑借十年前就啟動的AI專用服務(wù)器研發(fā)計劃,如今已具備更高效的運營能力。

編輯:邊慧婷

來源:The Information

END

       原文標題 : 10億用戶目標落空背后:OpenAI的組織、產(chǎn)品問題如何損害ChatGPT?丨T insights

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號