AI逼近「自我進化」的門檻

今年高考全國兩套卷子的作文一個寫「變」,一個寫「不變」。這個題目對AI大模型領域也非常應景。看懂哪些在變、哪些不變,對趨勢判斷至關重要。

前兩期我們談了中美AI的差距,以及研發層面拼的算力(包括背後的能源和其他基礎設施)、數據、演算法(背後是人才),側重不變的一些因素。

而日前Anthropic的一篇講遞歸式自我改進(recursive self-improvement,簡稱RSI)的文章,卻以不太尋常的方式,告訴大家最近半年大模型領域出現了一個新的大變數——大模型已經開始「自己造自己」了,而且進展速度比之前預想的快。

證據包括:1. 大模型獨立可靠地完成需要較長時間任務的能力提升在加速。幾年時間內,AI能完成的編程工作,從4分鐘提升到十幾個小時。也就是說,很多常規軟體開發工作AI自己就能完成了。

2. 大模型本身產品代碼很高比例已經是AI寫的了。Anthropic公司80%以上的代碼是AI寫的,而且質量已經追上工程師。

3. 更可怕的是,在科研環節,大模型的表現也越來越好。包括自主提出實驗想法、尋找訓練中出現問題的原因等等,已經可以與人類家抗衡。

開源AI智能體「龍蝦」端頁面 / 新華社發(伊凡攝)

雖然沒有信息表明,目前最強模型Mythos有多大程度得益於AI自我改進,但現在矽谷有一種濃厚的悲觀情緒,與這一進展是息息相關的。

一位投資界的朋友3月去矽谷考察,發現當地的AI精英們一方面在激烈競爭,不顧代價地投資、消耗AI算力,迭代速度已從「按月計算」變為「按周計算」;一方面內心又極為焦慮,剛博士畢業沒幾年的一線科學家,自嘲兩三年內自己也可能被AI淘汰,不少人更嚴肅地討論「買、建地堡、給家裡裝防彈玻璃」,為不遠的將來做準備:因為AI太強,大部分人在經濟系統中不再有用,會出現一個由「永久底層」構成的二元社會,社會治安隨之惡化……

這實際上帶我們回到人工智慧發展兩個更現實的問題:社會影響;應用與商業化。

社會影響有很多維度。中美之間可能差異最大的,是民眾對AI的態度。各種調查結果給出一致結論:民眾對AI是總體樂觀,最直觀的體現,是機器人、視頻生成等各種AI元素在合家歡春晚上越來越多;而則是「全民懷疑」,不僅普通老百姓不信任,感覺到威脅,大學生在畢業典禮上也紛紛向說AI好話的名人演講者報以噓聲,連獲益最大的矽谷精英,情緒也不是正面的。

直接帶來的反作用,就是美國本土數據中心等基礎建設落地困難。在政府大開綠燈、行業巨頭投資爆炸性增長的情況下,美國計劃於2027年竣工的數據中心產能中,超過60%至今尚未動工。重要的原因之一是民眾不支持。蓋洛普民調顯示,約七成美國人反對在其居住地附近建設AI數據中心。

3月20日,工作人員(右二)在向參觀者介紹一個家庭數據中心存儲設備 / 新華社記者 方喆 攝

應用與商業化方面,有兩個看起來相反的因素在起作用:一是模型能力過剩,很多能力已經超過日常所需,但大部分人還不太會用;二是模型的能力是鋸齒狀,有的方面非常強,有的方面又弱智得可笑(比如前一陣傳播很廣的「50米洗車問題」)。

與此同時,AI應用的成本還很高。就說,今年的AI預算4個月就花完了。

因此,尋找高價值且大模型能落地的場景,成了整個行業最大的戰略問題。Anthropic正是有點偶然地從用戶反饋中,抓住了編程這一差異點,成就了目前的領先地位。下一個大機會呢?如果編程及衍生出來的智能體能力就能覆蓋所有知識性工作場景,就意味著目前的格局將延續,直到影響藍領工作的具身智能/人形機器人進入主流。

*以上內容系網友事兒自行轉載自南風窗,該文僅代表原作者觀點和態度。yeeyi號系信息發布平台,僅提供信息存儲空間服務,不代表贊同其觀點和對其真實性負責。如果對文章或圖片/視頻版權有異議,請郵件至我們反饋,平台將會及時處理。

喜歡、支持,請轉發分享↓
贊助商鏈接