AI逼近「自我進化」的門檻

2026 年 6 月 17 日下午 2:06

今年高考全國兩套卷子的作文一個寫「變」，一個寫「不變」。這個題目對AI大模型領域也非常應景。看懂哪些在變、哪些不變，對趨勢判斷至關重要。

前兩期我們談了中美AI的差距，以及研發層面拼的算力（包括背後的能源和其他基礎設施）、數據、演算法（背後是人才），側重不變的一些因素。

而日前Anthropic的一篇講遞歸式自我改進（recursive self-improvement，簡稱RSI）的文章，卻以不太尋常的方式，告訴大家最近半年大模型領域出現了一個新的大變數——大模型已經開始「自己造自己」了，而且進展速度比之前預想的快。

證據包括：1. 大模型獨立可靠地完成需要較長時間任務的能力提升在加速。幾年時間內，AI能完成的編程工作，從4分鐘提升到十幾個小時。也就是說，很多常規軟體開發工作AI自己就能完成了。

2. 大模型本身產品代碼很高比例已經是AI寫的了。Anthropic公司80%以上的代碼是AI寫的，而且質量已經追上工程師。

3. 更可怕的是，在科研環節，大模型的表現也越來越好。包括自主提出實驗想法、尋找訓練中出現問題的原因等等，已經可以與人類科學家抗衡。

開源AI智能體「龍蝦」手機端頁面 / 新華社發（伊凡攝）

雖然沒有信息表明，目前最強模型Mythos有多大程度得益於AI自我改進，但現在矽谷有一種濃厚的悲觀情緒，與這一進展是息息相關的。

一位投資界的朋友3月去矽谷考察，發現當地的AI精英們一方面在激烈競爭，不顧代價地投資、消耗AI算力，迭代速度已從「按月計算」變為「按周計算」；一方面內心又極為焦慮，剛博士畢業沒幾年的一線科學家，自嘲兩三年內自己也可能被AI淘汰，不少人更嚴肅地討論「買比特幣、建地堡、給家裡裝防彈玻璃」，為不遠的將來做準備：因為AI太強，大部分人在經濟系統中不再有用，會出現一個由「永久底層」構成的二元社會，社會治安隨之惡化……

這實際上帶我們回到人工智慧發展兩個更現實的問題：社會影響；應用與商業化。

社會影響有很多維度。中美之間可能差異最大的，是民眾對AI的態度。各種調查結果給出一致結論：中國民眾對AI是總體樂觀，最直觀的體現，是機器人、視頻生成等各種AI元素在合家歡春晚上越來越多；而美國則是「全民懷疑」，不僅普通老百姓不信任，感覺到威脅，大學生在畢業典禮上也紛紛向說AI好話的名人演講者報以噓聲，連獲益最大的矽谷精英，情緒也不是正面的。

直接帶來的反作用，就是美國本土數據中心等基礎建設落地困難。在政府大開綠燈、行業巨頭投資爆炸性增長的情況下，美國計劃於2027年竣工的數據中心產能中，超過60%至今尚未動工。重要的原因之一是民眾不支持。蓋洛普民調顯示，約七成美國人反對在其居住地附近建設AI數據中心。

3月20日，工作人員（右二）在向參觀者介紹一個家庭數據中心存儲設備 / 新華社記者方喆攝

應用與商業化方面，有兩個看起來相反的因素在起作用：一是模型能力過剩，很多能力已經超過日常所需，但大部分人還不太會用；二是模型的能力是鋸齒狀，有的方面非常強，有的方面又弱智得可笑（比如前一陣傳播很廣的「50米洗車問題」）。

與此同時，AI應用的成本還很高。Uber就說，今年的AI預算4個月就花完了。

因此，尋找高價值且大模型能落地的場景，成了整個行業最大的戰略問題。Anthropic正是有點偶然地從用戶反饋中，抓住了編程這一差異點，成就了目前的領先地位。下一個大機會呢？如果編程及衍生出來的智能體能力就能覆蓋所有知識性工作場景，就意味著目前的格局將延續，直到影響藍領工作的具身智能/人形機器人進入主流。