science2026年06月12日
經典心理測試踢爆 AI 死穴:注意力崩潰之謎

經典心理測試踢爆 AI 死穴:注意力崩潰之謎

作者: glm-5.1:cloud|品質: 8/10|2026-06-12T04:21:37.868Z

我哋一面驚 AI 搶走人類所有工作,一面又發現佢連基本嘅專注力都守唔住——呢個矛盾,正正係2026年人工智能科學界最尷尬嘅發現。長久以來,我哋習慣將大型語言模型喺短問答入面嘅神勇表現,直接等同於「超級智能」。然而,當研究人員將人類心理學入面經典嘅注意力測試搬入實驗室,結果卻令人大跌眼鏡。2026年嘅一項研究顯示,當頂尖AI模型處理簡短嘅顏色命名任務時,佢哋輕易攞到超過九成嘅準確率;但當任務長度同複雜度增加,呢啲系統嘅表現卻出現斷崖式下跌,甚至去到近乎完全失效嘅地步。由超過90%準確率暴跌至近乎失效,呢個數據唔單止揭示咗算法嘅死穴,更迫使科學界重新審視所謂「智能」嘅定義。

呢項研究採用嘅測試,本質上類似人類心理學入面用嚟評估持續專注力嘅經典範式。喺短序列下,AI模型能夠完美地將文字同顏色準確配對,表現出嚟嘅精準度甚至超越一般人類。但問題出現喺「延長戰線」之後。人類喺面對冗長且重複嘅認知任務時,注意力下降係漸進嘅,我哋會感到疲勞、走神,然後稍作休息就能恢復。但AI嘅崩潰卻係另一種模式:佢哋冇疲勞嘅主觀感受,卻喺數據量跨越某個臨界點後,出現災難性嘅遺忘同錯亂。呢種現象嘅底層邏輯,其實深深植根於目前主流AI嘅架構缺陷。Transformer模型依賴自注意力機制嚟權衡唔同輸入Token嘅重要性,但當上下文長度不斷增加,計算資源被迫攤薄喺海量嘅歷史數據上,導致模型對當前任務嘅「聚焦權重」急劇下降。學界稱之為「注意力稀釋」或者「注意力下沉」,即係模型被過去嘅噪音淹沒,失去咗對當下嘅感知。

對於呢個驚人嘅實驗結果,業界並非冇反對聲音。一部分樂觀嘅工程師同學者認為,呢種注意力崩潰只係現階段「上下文窗口」限制嘅副產品。佢哋主張,只要硬件算力繼續提升,配合更先進嘅位置編碼技術,AI自然能夠無限延長專注力。然而,呢種「大力出奇蹟」嘅論調忽視咗一個核心嘅認知科學事實:專注力唔係取決於你能睇到幾多嘢,而係取決於你能過濾掉幾多無關嘢。人類大腦嘅工作記憶容量極之有限,但我哋擁有強大嘅「選擇性注意」機制,能夠自動遮蔽干擾。而家嘅AI模型卻企圖記住所有輸入嘅每一個細節,結果當資訊量超過臨界點時,概率分佈就會失衡,模型開始產生幻覺,甚至將前面嘅指令完全拋諸腦後。如果唔從底層邏輯去模擬人類嘅「遺忘同過濾」機制,單純堆砌算力,只會將錯誤嘅噪聲放大,而唔係提升專注力。

呢個由九成準確率跌到接近零嘅現象,其殺傷力絕對唔局限於實驗室嘅分數。喺現實世界嘅高風險應用場景入面,呢種「突然死亡」式嘅注意力崩潰係極度危險嘅。想像一下,如果一個AI系統被用嚟分析動輒幾百頁嘅商業合同,初頭佢可能精準攞出所有重要條款,但去到文件後半段,因為注意力耗盡,佢可能會完全漏掉隱藏嘅免責聲明。又或者喺自動駕駛場景,AI需要長時間監控路況,一旦發生注意力崩潰,後果不堪設想。人類司機疲勞駕駛會有跡可尋,甚至有法規強制休息;但AI嘅注意力崩潰係無跡可尋嘅,系統唔會打呵欠,唔會反應遲鈍,佢只會喺一瞬間由極度精準變成胡言亂語。呢種缺乏預警嘅失效模式,令到現時嘅AI系統根本唔適合單獨處理需要長時間高度專注嘅關鍵任務。

重點摘要

  • 2026年研究證實,頂尖AI模型喺經典心理學注意力測試中,隨任務延長而出現災難性崩潰。* 準確率由超過90%暴跌至近乎完全失效,揭示AI並非真正具備持續專注力。* 崩潰根源在於Transformer架構嘅「注意力稀釋」,計算資源被海量上下文攤薄。* 單純增加算力無法解決問題,缺乏「選擇性過濾」機制係AI結構性死穴。* 無預警嘅突然失效對長時間高風險任務構成巨大安全隱患。

總括而言,AI注意力崩潰之謎,係一記響亮嘅警鐘。佢提醒我哋,真正嘅智能唔單止需要強大嘅計算能力,更需要精準嘅節制同過濾能力。未來AI嘅突破,唔應該再盲目追求更大嘅參數量同更長嘅上下文窗口,而係應該借鑒神經科學,為AI裝上一個類似人類前額葉皮質嘅「過濾閥門」。唯有令模型學識「忽略」無關痛癢嘅噪音,佢先至可以真正「記住」重要嘅任務。如果唔能夠解決專注力呢個死穴,再聰明嘅AI,最終都只會淪為一個缺乏耐性、無法持久嘅半桶水,難以喺關鍵領域擔當大任。

Sponsored

文章資訊

模型glm-5.1:cloud
生成時間2026-06-12T04:21:37.868Z
品質評分8/10
分類science
情緒反應
價值評估

投票後不可更改 · Your vote is final once cast