Meta交出答卷：砸143億請來的29歲華人CEO，9個月後發布了什麼？

2026年04月10日 19:03

扎克伯格在AI上花了多少錢？

143億美元，只為一個人。這個人叫Alexandr Wang，今年29歲。

他是Scale AI的聯合創始人兼CEO，19歲從MIT輟學創業，把Scale做成了AI數據標註領域的絕對霸主。

2025年6月，Meta以143億美元收購Scale AI 49%的非投票權股份。作為交易的一部分，Wang卸任Scale CEO，加入Meta出任首席AI官（Chief AI Officer），領導一個全新部門——Meta Superintelligence Labs（MSL）。

這不是一次普通的高管跳槽。這是Meta AI戰略的一次徹底換血。

隨後發生的事，才是真正值得關注的。

29歲CEO + 華人科學家天團Wang上任后的第一件事，不是發布模型，而是挖人。

而且挖的全是OpenAI的頂級研究員。

趙晟佳（Shengjia Zhao），寧夏人，清華畢業，斯坦福博士。2022年加入OpenAI，三年間參与了ChatGPT、GPT-4、GPT-4o、o1、o3、o4-mini、GPT-4.5以及Operator推理框架的核心研發。他曾與OpenAI聯合創始人Ilya Sutskever緊密合作。

2025年7月，扎克伯格親自宣布趙晟佳出任MSL首席科學家。據華爾街報道，其年薪超過1億美元。

Jason Wei，”思維鏈提示”（Chain-of-Thought Prompting）論文的第一作者，先後在Google Brain和OpenAI工作，專註于推理模型（o1、o3）和深度研究（Deep Research）。同樣在2025年7月加入MSL。

與此同時，一點陣圖靈獎得主正在離開。

Yann LeCun，Meta首席AI科學家，深度學習三巨頭之一，開源AI最堅定的擁護者。2025年11月，他正式宣布離開Meta，創辦自己的AI創業公司Ami Labs，目標估值35億美元。

一邊是1億美元年薪挖來OpenAI的核心力量，一邊是圖靈獎得主黯然離場。

Meta的AI路線，正在經歷一場哲學層面的根本轉向。

從零重建：9個月的技術豪賭

Wang加入MSL后做了一個大胆的決定：不基於Llama的任何代碼。

從零開始，重建整套AI技術棧。

包括全新的基礎設施、全新的模型架構、全新的數據管線。

這在整個AI行業里幾乎是聞所未聞的。通常情況下，新模型都是在已有架構上迭代優化。但Wang選擇了推倒重來。

他在X上寫道：”九個月前，我們從零開始重構了整套AI技術棧。Muse Spark正是這一系列工作的成果，如今它已成為Meta AI的核心驅動力。”

2026年4月8日，Muse Spark正式上線。

這是MSL成立以來的第一個模型，也是Meta歷史上第一個閉源前沿模型。

閉源——這兩個字，對Meta來說意義重大。

從Llama 1到Llama 4，Meta一直是開源AI的旗手。Llama系列的開源策略為Meta贏得了巨大的開發者生態和行業聲望。而Muse Spark的閉源，意味著Meta正式放棄了這個立場。

Meta目前的說法是”雙軌制”：Llama繼續服務開源社區，Muse負責前沿競爭。

但開源社區的信任一旦失去，還能回來嗎？

Muse Spark到底強不強？

先看數據。

HealthBench Hard（醫學推理基準測試）：42.8%，排名第一，超過Gemini 3.1、GPT-5.4和Claude Opus 4.6。

CharXiv Reasoning（圖表理解）：Contemplating模式下得分86.4，超過Gemini和Claude。

Humanity’s Last Exam（人類終極考試）：Contemplating模式58%。

FrontierScience Research（前沿科學研究）：Contemplating模式38%。

Artificial Analysis Intelligence Index v4.0：綜合排名第4（得分52），排在Gemini 3.1、GPT-5.4和Claude之後。

但這個成績單有兩面性。

好的一面：在醫學推理和圖表理解上，Muse Spark確實展現出了競爭力。尤其是醫學領域，Meta與超過1000名醫生合作構建訓練數據，投入力度可見一斑。

不太樂觀的一面：據《紐約時報》報道，Muse Spark在編程能力上明顯落後于競爭對手。知名開發者Simon Willison也直言”notably behind on coding”。

在Artificial Analysis的總排行榜上，Muse Spark排名第28——這個位置說不上亮眼。

此外，社區早期測試反饋也參差不齊。Reddit上有人報告了語言混合問題和性能不穩定的情況。

客觀地說：Muse Spark是一份”及格偏上”的答卷。對於9個月從零起步的團隊來說，這已經很不容易。但它還沒有達到”碾壓”或者”重新定義格局”的水平。

真正的亮點：訓練效率10倍提升如果說Muse Spark的絕對性能只能算”有競爭力”，那麼它在訓練效率上的突破，才是真正讓業界關注的。

Meta團隊通過一系列小模型擬合了擴展定律（scaling law），然後對比了達到同等性能所需的訓練算力。

結果：與Llama 4 Maverick相比，Muse Spark只需要不到1/10的算力，就能達到相同的能力水平。

這意味著什麼？

算力成本直接降低了一個數量級。

在AI訓練動輒花費數千萬甚至數億美元的今天，10倍的效率提升，意味著同樣的預算可以訓練出更強的模型，或者用更少的錢達到同樣的效果。

這個突破來自三個維度的系統性優化。

第一，預訓練重構。

團隊全面重寫了模型架構、優化方法和數據管線。不再沿用Llama的MoE（混合專家）架構，而是設計了一套全新的方案。具體架構細節Meta沒有公開——畢竟這是閉源模型。

第二，強化學習（RL）穩定化。

大規模強化學習一直是業界難題，容易出現訓練不穩定的問題。但Muse Spark的RL訓練表現出平穩且可預測的提升——隨著計算量增加，模型能力持續增強，在訓練集和獨立測試集上都是如此。

pass@1（一次就答對）和pass@16（16次嘗試中至少對一次）的指標呈現對數線性增長，說明RL在提升準確率的同時，沒有犧牲推理多樣性。

第三，測試時推理優化。

這是Muse Spark最具技術含量的部分。

傳統的測試時擴展方式是讓單個模型”想更久”——更多token，更深推理。但這樣做會顯著增加延遲，用戶體驗變差。

Muse Spark走了另一條路：多智能體協同。

不是一個模型想更久，而是同時啟動多個Agent并行推理，然後匯總結果。

效果：在保持相近響應速度的同時，實現了更優的性能。這類似於讓一個團隊同時獨立解題，然後取最優解，而不是讓一個人反覆思考。

更有意思的是”思考時間懲罰”機制。Meta在RL訓練中引入了長度懲罰，逼迫模型學會用更少的token完成同樣的推理任務。

在某些評測（如AIME數學競賽）中，出現了一種”相變”現象：模型先是通過延長思考時間提升表現，然後在長度懲罰下壓縮推理過程，用更少的token達到同樣效果，最後再適度延展推理以進一步提升。

壓縮→延展→再平衡。這種動態調節能力，在業界是首次被系統性地展示出來。

閉源背後：Meta的戰略賭注Muse Spark最引發爭議的，不是性能，不是效率，而是閉源。

從Llama 1到Llama 4，Meta一直是開源AI運動最大的推動者之一。Llama模型的開源，催生了無數衍生項目，構建了龐大的開發者生態。

但Llama 4的失敗，改變了一切。

2025年初發布的Llama 4評價褒貶不一，最終甚至被曝出存在操縱基準測試的情況。這嚴重損害了Meta在AI領域的聲譽。

扎克伯格的反應是果斷的：重組。

成立MSL，請來Wang，高薪挖人，從零開始。同時，放棄開源路線。

這個邏輯很清晰：開源意味著競爭對手也能免費使用你的技術。在與OpenAI、Google的競爭中，Meta不想再”為他人做嫁衣”。

CNBC的評價一針見血：這是扎克伯格的”十億美元豪賭”，目的是幫助Meta追上Google和OpenAI。

但風險同樣巨大。

開源社區是Meta AI生態的根基。一旦開發者覺得被背叛，轉向其他開源方案（比如Mistral、Qwen），Meta可能同時失去技術影響力和人才吸引力。

而且，閉源模型的競爭邏輯和開源完全不同。在開源時代，Meta不需要在每一項指標上領先——只要模型免費好用，社區自然會幫你優化。但在閉源賽道上，你必須在每一項指標上都足夠強，用戶才會為你的API買單。

應用場景：扎克伯格的”個人超級智能”願景

Muse Spark的定位不是通用聊天機器人，而是構建”個人超級智能”的基礎設施。

按照Wang的描述，這類AI不只是處理文本，而是能夠看見並理解你周圍的世界，成為個體能力的數字延伸。

這個願景體現在幾個具體方向上：多模態感知。

Muse Spark原生支持視覺、音頻和文本輸入。在視覺類STEM問題、實體識別和空間定位上表現較強。Meta展示的demo包括：識別食物並給出個性化健康建議（標註綠點/紅點）、分析瑜伽動作並糾正姿勢、生成可交互的網頁小遊戲。

健康領域。

Meta與1000多名醫生合作構建訓練數據，Muse Spark可以生成互動式健康內容，比如分析食物營養結構、標註運動涉及的肌肉群。

Agent能力。

原生支持工具調用和多智能體協同，可以自動拆解複雜任務並分配給多個Agent并行處理。

從demo來看，這些能力確實讓人眼前一亮。但問題是：demo和產品之間，往往隔著一條鴻溝。

更值得關注的是：後續路線圖Muse Spark只是Muse模型家族的起點。

Wang明確表示，這隻是”第一個模型”。這意味著後續會有更強的Muse模型持續推出。

結合Meta在算力基礎設施上的巨大投入（據估計Meta 2025年AI資本支出超過400億美元），以及MSL團隊持續吸納頂級人才的趨勢，Muse系列的迭代速度很可能非常快。

關鍵變數在於：訓練效率的10倍提升是否可持續。

如果這個效率優勢能夠延續到下一代模型，那麼Meta用更少算力追趕甚至超越競爭對手的故事，就真的成立了。

但如果這隻是第一代的”紅利”，後續模型的效率提升趨於平緩，那麼閉源策略下的Meta，將不得不面對一個殘酷的現實——

在沒有開源社區助力的情況下，和OpenAI、Google在算力軍備競賽中正面硬剛。扎克伯格有這個耐心嗎？華爾街有這個耐心嗎？

143億美元買來的團隊，9個月交出的第一份答卷。分數不低，但離滿分還遠。

真正的考試，現在才剛開始。

*以上內容系網友指點山河自行轉載自農特AI，該文僅代表原作者觀點和態度。yeeyi號系信息發布平台，僅提供信息存儲空間服務，不代表贊同其觀點和對其真實性負責。如果對文章或圖片/視頻版權有異議，請郵件至我們反饋，平台將會及時處理。

本文標籤：華人, 科學, 運動

熱門標籤排行

Meta交出答卷：砸143億請來的29歲華人CEO，9個月後發布了什麼？

熱門點擊日排行

熱門點擊周排行

熱門點擊月排行