作者:不懂經也叔的Rust
轉載:不懂經
2026年5月,兩篇重磅研究在一周內相繼發表。
一組來自加州大學伯克利分校研究團隊,樣本是美國 20 所公立研究型大學的 95,513 名本科生。研究發表在《Science》科學雜誌上,主題是大學生如何使用生成式 AI,以及怎樣用它作弊。
另一組來自喬治城大學神經科學家 Adam Green 團隊。他們分析了超過 37萬份美國高中生的大學申請文書,試圖回答一個更隱蔽的問題:ChatGPT出現之後,年輕人的創造力發生了什麼變化。
這兩組數字看起來屬於兩個不同領域。一個談教育公平,一個談寫作創造力;一個研究大學生行為,一個研究高中生的申請文書內容。但它們最後指向同一個問題和同一條裂縫。
AI 時代最深的分水嶺,根本不在「有人用AI、有人不用AI」,或者「有人會用,有人不會用」。那只是第一層。那條線當然存在,但是很多人都看得到。真正隱蔽的區分,藏在一個大多數人還沒注意到的地方。
《了不起的蓋茨比》作者菲茨傑拉德說過一段話,後來成了常被引用的智慧檢驗標準:」對一流頭腦的測試,是看它有沒有能力同時持有兩個截然相反的觀點,而且依然能照常行事。」
這句話確實具有天才的洞察,但我覺得在AI這個時代,它需要加一個補充和延伸。
01
關鍵並不在於用或不用AI
伯克利那項研究的第一組數字,很容易讓人得出一個熟悉結論。
大約三分之二的本科生已經使用過生成式 AI,接近40%的學生至少每月使用一次。至少9%的 AI 使用者承認,自己曾用 AI 完成了本不被允許的任務。
研究還發現,AI 使用存在明顯差異。男性學生、白人和亞裔學生更常使用生成式 AI,女性學生、低收入學生和少數族裔學生使用得更少。
這聽起來像傳統的數字鴻溝。
過去的數字鴻溝,是誰家裡有電腦,誰家裡沒有電腦;誰能上網,誰不能上網;誰能用搜索引擎和英文資料,誰只能依賴學校課本。
今天它換成了另一種形態:誰能熟練使用 Claude、ChatGPT、NotebookLM,誰只能偶爾打開免費模型;誰知道怎樣讓 AI 幫自己拆論文、改代碼、做簡歷,誰連提示詞怎麼寫都不熟。
如果就業市場默認畢業生應該具備 AI 使用能力,那麼不用 AI 的學生當然會落後。
這套敘事沒有錯。
低收入家庭的孩子買不起更強的模型,訪問次數受限,訓練機會更少。將來面試時,僱主問他是否熟悉 AI 工作流,他可能只能回答「用過一點」。同樣是大學生,有人已經把 AI 變成隨身研究助理,有人還停留在複製粘貼。
差距會從課堂進入實習,從實習進入第一份工作,再從第一份工作進入一生的收入曲線。
如果故事只到這裏,解決方案就很簡單:給每個學生髮 AI 賬號,把 AI 納入課程,教他們正確使用。
但伯克利研究里還有另一個數字,才是更加值得警惕的。
02
同一個滑梯上的兩種人
伯克利研究發現,每天使用 AI 的學生中,26% 承認用 AI 作弊;每月使用 AI 的學生中,這個比例只有 7%。
這不是一個小差異。
它說明 AI 使用並不是一條單向的進步曲線。用得更多,不一定等於學得更好。
AI 像一條滑梯。
一開始你只是想省一點時間。讓它幫你解釋一個概念,潤色一段文字,整理一組資料。很快,它就開始進入任務的核心部分。你不再讓它「幫我理解」,而是讓它「幫我完成」。再往後,你開始習慣直接拿到一個成品,然後在成品上改幾句,把它偽裝成自己的工作。
這個過程沒有明顯的道德斷點。
今天的工具設計,本來就在模糊邊界。你用 Google,頁面上已經有 AI 總結。你用語法檢查工具,下一步就是全文重寫。你讓模型解釋一個概念,它順手就會給你生成一份作業結構。學生很難一直清楚地知道:我現在是在學習,還是在替代學習?
學生可能交出一份很漂亮的成果,甚至拿到好成績,但那個作業本來要訓練的能力並沒有長出來。
這才是問題的核心。
教育里的很多任務,本來就不是為了那個結果。
寫論文不是為了交出五頁紙,是為了在材料、證據、觀點之間反覆拉扯。做題不是為了答案,是為了讓大腦經歷那段從混亂到清楚的過程。寫代碼不是為了程序最終跑起來,是為了在錯誤里形成判斷:哪裡可能壞,為什麼壞,下次怎樣提前避開。
AI 最擅長的,恰恰是把這些過程摺疊掉。它讓你直接看到結果。
於是,學生們有了兩種完全不同的發展態勢。
第一種學生,本來已經有某種基本功。AI 幫他節省體力,擴大資料範圍,測試更多方向。他知道哪裡該信,哪裡要查,哪裡只是語言漂亮。他用 AI 像用槓桿。
第二種學生,還沒有形成基本功。AI 給他答案,也給他語氣,給他結構,給他判斷。他交出了作品,卻沒有經歷作品形成的那段路。他用 AI 像用假肢。
外表上,這兩個人越來越像。他們的作業都整齊,郵件都禮貌,報告都有結構,PPT 都像諮詢公司。
區別藏在工具關閉之後。
要判斷學生真正的學習力,就是讓他們每次用AI的時候問自己三個問題:我能不靠這個工具解釋清楚嗎?明天我能獨立完成類似的任務嗎?AI是幫我理解得更深了,還是只是幫我完成得更快了?
這三個問題,正好把AI用戶群體切成了完全不同的兩種人。一種人問不出來這三個問題。另一種人問完之後還能給出肯定的答案。這兩種人的差距,比」用AI」和」不用AI」的差距大得多。
正如我在之前的文章里反覆討論過的一個詞:去技能化。AI未必立刻讓你失業,但它可能先把」本來會做這件事」的手感、判斷和篤定,從你身上一點一點抽走。你看起來產出更多了,但支撐這些產出的能力卻在變薄。
03
37萬份高中生文書暴露的深層問題
Adam Green 團隊研究的是大學申請文書,這是一種很特殊的文本。
大學申請文書不是普通作文。它的功能,是讓一個年輕人從分數、活動、簡歷這些標準化信息里走出來,告訴招生官:我是一個具體的人,我有怎樣的經歷、困惑、慾望、失敗和理解。
換句話說,它本來應該是最抗標準化的文本之一。
Green 團隊追蹤了 37 萬多份申請文書,把 ChatGPT 出現前後的變化放在一起看。結果很微妙。
ChatGPT出現之後,文書的詞彙更豐富,句子更流暢,表達更像「好文章」。人類評委甚至更容易給這些文章打出更高的創造力評分。
但底層想法變得更相似。
語言外殼在升級,思想差異在收縮。
紐約時報的文章里引用了這個研究,並提出一個關鍵判斷:人類第一次擁有了一種可以脫離思想本身生成語言的技術。它可以識別哪些詞語組合看起來高級,哪些句子節奏像創造力,哪些轉折能讓讀者產生「這個人有想法」的錯覺。
但它並不保證那些詞語背後真的有新的想法。
這就是 AI 寫作最危險的地方。它不會讓每個人都寫得很差。相反,它會讓很多人寫得更像優秀範文。
過去,平庸文章有平庸文章的樣子。詞窮、結構散、表達笨拙,老師和讀者很容易看出來。現在,空洞可以穿上漂亮衣服。
更麻煩的是,評委也會被這件衣服騙過。
Green 團隊相關研究顯示,人類寫作能帶來的新想法數量,最多可以達到 AI 生成內容的數倍。另一篇發表在 ScienceDirect 的研究也分析了大學申請文書中的創造性多樣性,結論類似:每增加一篇人類寫作,能帶來的新想法更多;樣本規模越大,AI 文本的同質化問題越明顯。
這不是簡單的「AI 寫得不好」。AI 寫得很好。問題在於,它把「好」的標準變窄了。
Science Advances上關於短篇小說的實驗也有類似發現。AI 可以讓部分寫作者的故事更好讀、更完整、更像可發表作品。但當很多人都藉助 AI 寫故事時,故事之間的相似度上升,整體多樣性下降。
這就是創造力的悖論。
從個人角度看,你確實寫得更好了。但從群體角度看,世界變得更像了。
最可怕的部分在於,AI 對離均值最遠的人影響最大。紐約時報的文章中提到,語言少數群體、少數族裔學生,以及可能的神經多樣性學生,他們原本最獨特的表達,反而最容易被 AI 拉回主流模板。
這幾乎是一個文明層面的反諷。
我們以為 AI 會幫助弱勢學生補足表達差距,結果它也可能把他們最珍貴的差異抹平。
如果 AI 是一台均值回歸機器,它真正消滅的就不是錯誤,而是偏離均值的那部分生命經驗。
04
AI使用產生的三大悖論
把這兩組研究放在一起看,會出現三個悖論。
第一個悖論:不用AI,會落後;用太多AI,會空心化。
伯克利研究說明了這一點。低使用率群體會面臨工具差距,高使用率群體又可能陷入依賴和作弊。一個技術同時製造兩種劣勢。
前一種劣勢看得見,后一種劣勢很隱蔽。
不用 AI 的人,效率差距立刻出現。用AI 太多的人,能力損失要過一段時間才顯形。等到顯形時,他可能已經拿到一串漂亮成績,一份不錯簡歷,甚至一份體面的工作。
然後某一天,他需要在沒有模板、沒有提示、沒有現成答案的地方作判斷。
那一刻,賬才會算出來。
第二個悖論:AI 幫你寫得更好,卻讓你想得更淺更窄。
37萬份申請文書的研究最刺痛人的地方在這裏。語言質量提升,思想多樣性下降。評委還未必看得出來。
這會破壞整個教育系統的判斷標準。
過去,老師看到一篇文章,可以從笨拙之處看見學生正在思考。現在,老師看到一篇漂亮文章,反而要懷疑裏面有沒有學生。過去,僱主通過寫作判斷一個人的理解力。現在,寫作越來越像包裝層。
文字的外殼越來越精美,思想的核越來越空心。
第三個悖論:AI對最獨特的人傷害最大。
這是最可怕、最容易被忽略的一點。
很多人以為 AI 會把底層學生往上托,把表達不好的人訓練得更體面。它確實有這個功能。問題是,它托舉人的方式,常常是把他托向平均值。
一個移民家庭學生原本可能寫出帶有混雜語法、家庭口音和特殊記憶的文章。那篇文章不一定流暢,卻有不可複製的紋理。AI 會幫他改得更像標準英語,更像優秀申請文書,也更像幾萬份別人的申請文書。
一個神經多樣性學生原本可能用非常規路徑理解世界。AI 會幫他把跳躍變成連貫,把奇怪變成自然,把尖銳變成得體。
這在申請系統里可能更安全。但創造力常常就藏在那些不安全的地方。
如果所有離經叛道的表達都被修成「成熟、清晰、有說服力」,我們得到的不是更公平的創造力,而是一種更高級的同質化。
05
創造力不是結果,是過程
矽谷喜歡給 AI 一個很誘人的承諾:讓機器處理無聊的部分,人類專註創造性的工作。這句話的問題在於,它誤解了創造力。
無聊的部分並不總是創造力的障礙。很多時候,它就是創造力的燃料。
一個分析師翻看原始數據時,可能在某個異常值里發現真正的問題。一個作家刪掉三千字廢稿時,可能才發現自己真正想寫的不是這個題目。一個程序員調 bug 時,才慢慢形成系統感。一個學生寫不出開頭,在紙上亂畫十分鐘,那十分鐘並沒有浪費。
空白頁很痛苦,但空白頁不是敵人。
它是思考開始工作的地方。
很多人使用 AI,並不是為了處理行政雜務,而是為了逃避最痛苦的認知階段。那個階段就是面對空白、忍受混亂、自己生成第一個方向。
AI 最誘人的功能,就是讓你不用經歷這一刻。
你輸入一句話,它給你十個方向。每個方向都合理、完整、像那麼回事。你立刻獲得一種輕鬆感,好像創造力已經啟動了。
可它也完成了錨定。
一旦第一個方向出現,人很容易圍繞它修修補補。你以為自己在創作,其實是在給機器的第一個答案做裝修。
沃頓研究關於 AI 頭腦風暴的討論也指向類似問題:AI 能提高個人產出的數量和表面質量,卻容易讓群體想法變得集中。哥倫比亞商學院關於模型偏好的研究則提醒,早出現的選項會影響後續判斷,更好的想法可能還沒來得及出現,就被第一個體面答案擋住了。
創造力不是最後那段漂亮文字。
創造力是你在錯誤、遲疑、推翻、重來里形成的路徑。
AI 可以代你走完路徑,但它不能把走路長出的肌肉轉移給你。
這也是 AI 與過去工具最不一樣的地方。
文字削弱了口頭記憶,卻打開了歷史、法律和科學。計算器削弱了心算,卻讓更多人能處理複雜數學。搜索引擎削弱了背誦,卻擴大了信息可達性。
每一次能力外包,都伴隨新的能力形成。AI 的特殊之處在於,它外包的往往不是某一項能力,而是形成能力的過程。
這才是風險所在。
06
真正的分水嶺:判斷力基線
AI時代的階層分水嶺到底是什麼。
不是」會」和」不會」。」會」用AI這件事的門檻正在以月為單位下降。今天的工具比半年前的好用得多,半年後的工具會用起來更簡單。
把時間拉長到三年,用不用AI、用得好不好,很可能不再是決定性的競爭變數。就像今天沒有人會因為自己」會用搜索引擎」而覺得自己有不可替代的優勢。
真正的分水嶺,是你有沒有在AI到來之前,或者使用AI之前,建立了自己的判斷力基線。
什麼算基線?
就是你在沒有任何外部工具的情況下,獨立拆解過一個複雜問題,獨立寫過一篇邏輯完整的論證,獨立做過一次研究,發現過AI給你的總結其實漏掉了最關鍵的部分,獨立在沒有人提示的情況下想過」這件事有沒有另一種可能」。
這些經歷,不只是在你的技能表上增加了一行。它們在你腦子裡刻下了某種」對的」和」不對的」的直覺。這種直覺,讓你在AI遞給你一份漂亮的輸出時,能停下來感覺到」這個地方不對」。
這跟聰明不聰明沒關係。而是你曾經走過那條自己推導的路,你知道真正的好答案長什麼樣。
《了不起的蓋茨比》作者菲茨傑拉德說過一段話,後來成了常被引用的智慧檢驗標準:」對一流頭腦的測試,是看它有沒有能力同時持有兩個截然相反的觀點,而且依然能照常行事。」
我非常喜歡這段話,但我覺得在這個時代,它需要一個補充。
AI時代的智力測試不再是」你能否同時持有兩個相反的觀點」,而是」當AI遞給你一個流暢、完整、看起來極其專業的答案時,你是否有能力判斷它是對的還是錯的、深的還是淺的、真正的好東西還是看上去很好。」
而要擁有這種判斷力,只有一個途徑:你在沒有AI的時候,做過足夠多的笨拙的、低速的、走彎路的、沒人旁觀的學習。
這不是在懷舊。這是一個冷酷的結構性問題。
Berkeley研究里那個悖論,不用AI的落後了、用太多AI的變空了,指向的其實是同一種困境:判斷力基線的缺失。不用AI的學生,缺工具,但真正缺的是另一件東西:」用工具之前的那個自己」。用太多AI的學生,有效率,但真正缺的也是同一件東西:」在效率之外判斷什麼是值得做的那個自己」。
我在之前的文章中討論過去技能化的時候,提過一個判斷:只有本來就有基本功的人,才有資格談」監督AI」。
不會寫的人,很難真正修改AI的文字;不懂研究的人,很難發現AI總結時遺漏了什麼;不懂代碼的人,也不可能真正判斷一段AI生成的程序到底穩不穩。沒有基線的人,表面在和AI協作,實際上在把自己的判斷權交出去。
今天我把這個判斷往前推一步。
AI時代真正的三層結構,遠比」會用AI」和」不會用AI」複雜:第一層:還沒有建立基線,也不會用AI。這類人面臨的是老式的不平等:效率被碾壓,選擇被壓縮,被時代拋在後面。
第二層:還沒有建立基線,但會用AI。這類人是AI時代最危險的位置。表面上和第一層完全不同:產出漂亮、表達流暢、看起來很專業。但內核和第一層一樣脆弱:一旦離開工具,無法獨立完成任何有深度的思考。更糟的是,他們不知道自己不知道。AI給的流暢答案,讓他們誤以為自己懂了。
第三層:在AI到來之前已經建立了基線,然後把AI當加速器用。他們知道一個真正的好答案長什麼樣,因為他們自己寫過。他們知道AI的總結可能漏掉了哪一類東西,因為他們自己總結過。他們在AI給出的方案里能認出」這個地方有問題」,不是靠直覺,是靠自己走過那條路的肌肉記憶。
這裏的關鍵詞是」在AI到來之前」,或者「使用AI之前」。
不是」在AI到來之後你再怎麼努力」,是」之前」。因為AI一旦無處不在,它就把建立基線所需要的那條路從環境里拿掉了。那條路本來是用最笨的方式從頭學,在沒有提示的情況下自己撞牆。現在它不存在了。
這不是一個技術能力的問題。這是一個技術環境的問題。你沒有選擇不走那條路,因為那條路已經不存在了。
07
比判斷力更重要的事
如果只是停在」判斷力基線很重要」這個層面,這篇文章和另一篇講」AI時代你需要什麼能力」的文章沒有區別。
Green研究里那個很少有人注意的細節,才是真正值得一談的地方:AI對有獨特視角的人傷害最大。
這個發現,把整個討論從」技能」層面拉到了」人是什麼」的層面。
一個人的獨特視角,不是一種可以被主動」培養」的技能。它來自你生在什麼樣的家庭,說的什麼語言,是不是習慣性地聽不懂主流敘事,是不是總在別人覺得理所當然的地方停下來問」為什麼」。這些差異,不是」訓練」出來的。它們是」存在」出來的。
AI作為一種均值回歸機器,在生產力層面幫你更快地產出更標準的好東西。但在存在層面,它在減輕你和世界的摩擦的同時,也在減輕」你之所以是你」的那些東西。
格林研究里提到的神經多樣性學生、少數族裔、非母語者,他們和平均值之間的摩擦最大。而這種摩擦,恰好是他們可能產生最獨特思想的來源。AI把它們抹平了。
這不是惡意,不是陰謀,是數學和演算法。
我在之前的文章里反覆討論過一個麥克盧漢式的命題:媒介即訊息。當你的思考媒介是一個模式匹配引擎,你變成什麼樣的思考者?當你的寫作媒介是一個詞語預測機器,你變成什麼樣的寫作者?當你的」創造力」由你最不可能想到的東西來定義,而那東西恰好是被演算法排除掉的,你還剩下什麼?
最後再講一個關於創造力的故事。
羅馬尼亞裔法國遺傳學家弗朗索瓦·雅各布,1965年拿了諾貝爾獎。有人問他科學研究的秘訣是什麼。
他的回答很短:」創造即重組。」
他在自己的實驗室日記里寫過更完整的一句話:一個新想法,不過是把兩個彼此認識但從未被介紹給對方的老想法,放在同一個房間里。
這個比喻我很喜歡,因為它恰好解釋了為什麼AI時代的判斷力基線危機,是一個人類問題,不是一個技術問題。
兩個從未被放在同一個房間里的老想法。這件事的前提是,你的腦子裡有足夠多、足夠不相關的老想法。而獲得這些老想法的唯一途徑,是你曾經在沒有外部加速器的情況下,扎紮實實地、笨拙地、低效地學過很多東西。那些東西當時看起來沒連接,日後才有機會在某個意想不到的瞬間撞出火花。
AI可以幫你把已經建立的老想法加速連接,但它不能替你做」建立老想法」這件事。因為建立老想法的過程,只能是緩慢的、親身經歷的、帶著困惑和重複的。它需要的不是更好的prompt,是時間和真實的活動。
AI時代真正的階層分水嶺,不是你會不會用AI,甚至不是你現在用AI用得有多好,而是你有沒有在那個」什麼都能幫你的AI」到來之前,用自己的腦子,走過足夠長的、沒人看見的、獨特的路。
這才是AI真正無法替代的。
*以上內容系網友會火自行轉載自視角學社,該文僅代表原作者觀點和態度。yeeyi號系信息發布平台,僅提供信息存儲空間服務,不代表贊同其觀點和對其真實性負責。如果對文章或圖片/視頻版權有異議,請郵件至我們反饋,平台將會及時處理。