Meta交出答卷:砸143億請來的29歲華人CEO,9個月後發布了什麼?

2026年04月10日 19:03

扎克伯格在AI上花了多少錢?

143億美元,只為一個人。這個人叫Alexandr Wang,今年29歲。

他是Scale AI的聯合創始人兼CEO,19歲從MIT輟學創業,把Scale做成了AI數據標註領域的絕對霸主。

2025年6月,Meta以143億美元收購Scale AI 49%的非投票權股份。作為交易的一部分,Wang卸任Scale CEO,加入Meta出任首席AI官(Chief AI Officer),領導一個全新部門——Meta Superintelligence Labs(MSL)。

這不是一次普通的高管跳槽。這是Meta AI戰略的一次徹底換血。

隨後發生的事,才是真正值得關注的。

29歲CEO + 家天團Wang上任后的第一件事,不是發布模型,而是挖人。

而且挖的全是OpenAI的頂級研究員。

趙晟佳(Shengjia Zhao),寧夏人,清華畢業,斯坦福博士。2022年加入OpenAI,三年間參与了ChatGPT、GPT-4、GPT-4o、o1、o3、o4-mini、GPT-4.5以及Operator推理框架的核心研發。他曾與OpenAI聯合創始人Ilya Sutskever緊密合作。

2025年7月,扎克伯格親自宣布趙晟佳出任MSL首席科學家。據華爾街報道,其年薪超過1億美元。

Jason Wei,”思維鏈提示”(Chain-of-Thought Prompting)論文的第一作者,先後在Google Brain和OpenAI工作,專註于推理模型(o1、o3)和深度研究(Deep Research)。同樣在2025年7月加入MSL。

與此同時,一點陣圖靈獎得主正在離開。

Yann LeCun,Meta首席AI科學家,深度學習三巨頭之一,開源AI最堅定的擁護者。2025年11月,他正式宣布離開Meta,創辦自己的AI創業公司Ami Labs,目標估值35億美元。

一邊是1億美元年薪挖來OpenAI的核心力量,一邊是圖靈獎得主黯然離場。

Meta的AI路線,正在經歷一場哲學層面的根本轉向。

從零重建:9個月的技術豪賭

Wang加入MSL后做了一個大胆的決定:不基於Llama的任何代碼。

從零開始,重建整套AI技術棧。

包括全新的基礎設施、全新的模型架構、全新的數據管線。

這在整個AI行業里幾乎是聞所未聞的。通常情況下,新模型都是在已有架構上迭代優化。但Wang選擇了推倒重來。

他在X上寫道:”九個月前,我們從零開始重構了整套AI技術棧。Muse Spark正是這一系列工作的成果,如今它已成為Meta AI的核心驅動力。”

2026年4月8日,Muse Spark正式上線。

這是MSL成立以來的第一個模型,也是Meta歷史上第一個閉源前沿模型。

閉源——這兩個字,對Meta來說意義重大。

從Llama 1到Llama 4,Meta一直是開源AI的旗手。Llama系列的開源策略為Meta贏得了巨大的開發者生態和行業聲望。而Muse Spark的閉源,意味著Meta正式放棄了這個立場。

Meta目前的說法是”雙軌制”:Llama繼續服務開源社區,Muse負責前沿競爭。

但開源社區的信任一旦失去,還能回來嗎?

Muse Spark到底強不強?

先看數據。

HealthBench Hard(醫學推理基準測試):42.8%,排名第一,超過Gemini 3.1、GPT-5.4和Claude Opus 4.6。

CharXiv Reasoning(圖表理解):Contemplating模式下得分86.4,超過Gemini和Claude。

Humanity’s Last Exam(人類終極考試):Contemplating模式58%。

FrontierScience Research(前沿科學研究):Contemplating模式38%。

Artificial Analysis Intelligence Index v4.0:綜合排名第4(得分52),排在Gemini 3.1、GPT-5.4和Claude之後。

但這個成績單有兩面性。

好的一面:在醫學推理和圖表理解上,Muse Spark確實展現出了競爭力。尤其是醫學領域,Meta與超過1000名醫生合作構建訓練數據,投入力度可見一斑。

不太樂觀的一面:據《紐約時報》報道,Muse Spark在編程能力上明顯落後于競爭對手。知名開發者Simon Willison也直言”notably behind on coding”。

在Artificial Analysis的總排行榜上,Muse Spark排名第28——這個位置說不上亮眼。

此外,社區早期測試反饋也參差不齊。Reddit上有人報告了語言混合問題和性能不穩定的情況。

客觀地說:Muse Spark是一份”及格偏上”的答卷。對於9個月從零起步的團隊來說,這已經很不容易。但它還沒有達到”碾壓”或者”重新定義格局”的水平。

真正的亮點:訓練效率10倍提升如果說Muse Spark的絕對性能只能算”有競爭力”,那麼它在訓練效率上的突破,才是真正讓業界關注的。

Meta團隊通過一系列小模型擬合了擴展定律(scaling law),然後對比了達到同等性能所需的訓練算力。

結果:與Llama 4 Maverick相比,Muse Spark只需要不到1/10的算力,就能達到相同的能力水平。

這意味著什麼?

算力成本直接降低了一個數量級。

在AI訓練動輒花費數千萬甚至數億美元的今天,10倍的效率提升,意味著同樣的預算可以訓練出更強的模型,或者用更少的錢達到同樣的效果。

這個突破來自三個維度的系統性優化。

第一,預訓練重構。

團隊全面重寫了模型架構、優化方法和數據管線。不再沿用Llama的MoE(混合專家)架構,而是設計了一套全新的方案。具體架構細節Meta沒有公開——畢竟這是閉源模型。

第二,強化學習(RL)穩定化。

大規模強化學習一直是業界難題,容易出現訓練不穩定的問題。但Muse Spark的RL訓練表現出平穩且可預測的提升——隨著計算量增加,模型能力持續增強,在訓練集和獨立測試集上都是如此。

pass@1(一次就答對)和pass@16(16次嘗試中至少對一次)的指標呈現對數線性增長,說明RL在提升準確率的同時,沒有犧牲推理多樣性。

第三,測試時推理優化。

這是Muse Spark最具技術含量的部分。

傳統的測試時擴展方式是讓單個模型”想更久”——更多token,更深推理。但這樣做會顯著增加延遲,用戶體驗變差。

Muse Spark走了另一條路:多智能體協同。

不是一個模型想更久,而是同時啟動多個Agent并行推理,然後匯總結果。

效果:在保持相近響應速度的同時,實現了更優的性能。這類似於讓一個團隊同時獨立解題,然後取最優解,而不是讓一個人反覆思考。

更有意思的是”思考時間懲罰”機制。Meta在RL訓練中引入了長度懲罰,逼迫模型學會用更少的token完成同樣的推理任務。

在某些評測(如AIME數學競賽)中,出現了一種”相變”現象:模型先是通過延長思考時間提升表現,然後在長度懲罰下壓縮推理過程,用更少的token達到同樣效果,最後再適度延展推理以進一步提升。

壓縮→延展→再平衡。這種動態調節能力,在業界是首次被系統性地展示出來。

閉源背後:Meta的戰略賭注Muse Spark最引發爭議的,不是性能,不是效率,而是閉源。

從Llama 1到Llama 4,Meta一直是開源AI最大的推動者之一。Llama模型的開源,催生了無數衍生項目,構建了龐大的開發者生態。

但Llama 4的失敗,改變了一切。

2025年初發布的Llama 4評價褒貶不一,最終甚至被曝出存在操縱基準測試的情況。這嚴重損害了Meta在AI領域的聲譽。

扎克伯格的反應是果斷的:重組。

成立MSL,請來Wang,高薪挖人,從零開始。同時,放棄開源路線。

這個邏輯很清晰:開源意味著競爭對手也能免費使用你的技術。在與OpenAI、Google的競爭中,Meta不想再”為他人做嫁衣”。

CNBC的評價一針見血:這是扎克伯格的”十億美元豪賭”,目的是幫助Meta追上Google和OpenAI。

但風險同樣巨大。

開源社區是Meta AI生態的根基。一旦開發者覺得被背叛,轉向其他開源方案(比如Mistral、Qwen),Meta可能同時失去技術影響力和人才吸引力。

而且,閉源模型的競爭邏輯和開源完全不同。在開源時代,Meta不需要在每一項指標上領先——只要模型免費好用,社區自然會幫你優化。但在閉源賽道上,你必須在每一項指標上都足夠強,用戶才會為你的API買單。

應用場景:扎克伯格的”個人超級智能”願景

Muse Spark的定位不是通用聊天機器人,而是構建”個人超級智能”的基礎設施。

按照Wang的描述,這類AI不只是處理文本,而是能夠看見並理解你周圍的世界,成為個體能力的數字延伸。

這個願景體現在幾個具體方向上:多模態感知。

Muse Spark原生支持視覺、音頻和文本輸入。在視覺類STEM問題、實體識別和空間定位上表現較強。Meta展示的demo包括:識別食物並給出個性化健康建議(標註綠點/紅點)、分析瑜伽動作並糾正姿勢、生成可交互的網頁小遊戲。

健康領域。

Meta與1000多名醫生合作構建訓練數據,Muse Spark可以生成互動式健康內容,比如分析食物營養結構、標註運動涉及的肌肉群。

Agent能力。

原生支持工具調用和多智能體協同,可以自動拆解複雜任務並分配給多個Agent并行處理。

從demo來看,這些能力確實讓人眼前一亮。但問題是:demo和產品之間,往往隔著一條鴻溝。

更值得關注的是:後續路線圖Muse Spark只是Muse模型家族的起點。

Wang明確表示,這隻是”第一個模型”。這意味著後續會有更強的Muse模型持續推出。

結合Meta在算力基礎設施上的巨大投入(據估計Meta 2025年AI資本支出超過400億美元),以及MSL團隊持續吸納頂級人才的趨勢,Muse系列的迭代速度很可能非常快。

關鍵變數在於:訓練效率的10倍提升是否可持續。

如果這個效率優勢能夠延續到下一代模型,那麼Meta用更少算力追趕甚至超越競爭對手的故事,就真的成立了。

但如果這隻是第一代的”紅利”,後續模型的效率提升趨於平緩,那麼閉源策略下的Meta,將不得不面對一個殘酷的現實——

在沒有開源社區助力的情況下,和OpenAI、Google在算力軍備競賽中正面硬剛。扎克伯格有這個耐心嗎?華爾街有這個耐心嗎?

143億美元買來的團隊,9個月交出的第一份答卷。分數不低,但離滿分還遠。

真正的考試,現在才剛開始。

*以上內容系網友指點山河自行轉載自農特AI,該文僅代表原作者觀點和態度。yeeyi號系信息發布平台,僅提供信息存儲空間服務,不代表贊同其觀點和對其真實性負責。如果對文章或圖片/視頻版權有異議,請郵件至我們反饋,平台將會及時處理。