我哋打造人工智能,本意係要佢超越人類嘅智慧,但偏偏 OpenAI 喺 2026 年最令人信服嘅突破,最後都要靠人類學者蓋章先算數。呢個充滿矛盾嘅現實,正正反映咗當前 AI 發展嘅核心困境:機器可以計出答案,但「信任」呢家嘢,依然係人類嘅專利。舊年 OpenAI 曾經高調宣佈解決咗傳奇數學家愛爾迪斯(Paul Erdős)嘅經典難題,點知最後被踢爆只係模型將訓練數據入面嘅現有證明「翻炒」出嚟,搞到一鑊泡。近期佢哋捲土重來,今次終於帶住一個唔同嘅籌碼——曾經狠批佢哋嘅權威學者托馬斯·布魯姆(Thomas Bloom)親自認可,仲共同發表咗論文。由「被踢爆」到「被認證」,呢段歷程揭示咗啲咩?
首先,我哋必須要理解舊年嗰次「滑鐵盧」對成個 AI 行業嘅警示。當時 OpenAI 以為自己嘅模型突破咗數學推理嘅瓶頸,但實際上只係暴露咗大型語言模型最致命嘅弱點:數據污染同埋記憶覆用。模型並冇真正「推導」出答案,而係認出咗訓練庫入面嘅人類解法,然後包裝成自己嘅輸出。呢種「鸚鵡學舌」嘅現象,令到學界對 AI 產生極大嘅戒心。數學唔係淨係要一個正確嘅數字,而係要一條無懈可擊嘅邏輯鏈。當 AI 無法解釋自己嘅推理過程,甚至係靠抄襲嚟矇混過關,佢產生嘅就唔係知識,而係幻覺。
不過,近期呢次成功認證,代表咗 AI 推理能力嘅一種質變。今次最關鍵嘅分別在於「人類背書」。托馬斯·布魯姆作為愛爾迪斯問題網站嘅維護者,本身就有絕對嘅學術權威,佢舊年嘅批評直擊要害,而家佢選擇共同發表論文,等於用自己嘅學術聲譽為呢個 AI 結果做擔保。呢個舉動打破咗 AI 同學界之間嘅隔閡。AI 唔再係一個自說自話嘅黑箱,而係變成一個可以同人類協作、接受檢驗嘅研究夥伴。布魯姆嘅參與,唔單止驗證咗結果嘅正確性,更加重要嘅係,佢填補咗 AI 由「輸出答案」到「形成知識」之間嗰段信任空白。
然而,我哋亦要從呢件事睇到一個更深層嘅隱憂:AI 嘅產能同人類嘅驗證能力之間,出現咗嚴重嘅錯配。如果每一次 AI 聲稱自己有重大突破,都需要頂尖學者花費大量時間去逐步核實,咁 AI 嘅發展速度最終會被「人類信任嘅瓶頸」所拖慢。數學界甚至整個科學界,有冇足夠嘅人力去充當每一個 AI 突破嘅「驗證者」?另一方面,有人可能會質疑,如果一個證明必須要人類專家背書先至被接受,咁 AI 到底係咪真正具備獨立嘅數學直覺?定係佢只係一個極度高效嘅計算工具?呢種觀點認為,真正嘅智能應該能夠自我證明,而唔係依賴人類嘅蓋章。不過,換個角度諗,科學嘅本質本來就係建立喺人類共識之上。就算係人類數學家提出嘅猜想,都需要經過同行評審先至會被接納。AI 嘅結果需要人類把關,並唔代表 AI 冇能力,而係反映咗知識生產必須要有社會契約。AI 可以提供答案,但只有人類社群可以賦予答案「真理」嘅地位。
重點摘要
- OpenAI 舊年嘅愛爾迪斯難題解答被揭發係「翻炒」訓練數據,近期終於獲得權威學者托馬斯·布魯姆嘅認證。* 布魯姆唔單止認可結果,更與 OpenAI 共同發表論文,為呢次突破提供咗關鍵嘅人類信任基礎。* AI 嘅數學推理能力固然有進步,但目前嘅「可信度」依然受制於人類專家嘅把關同背書。* AI 產能同人類驗證能力之間嘅錯配,可能成為未來科技發展嘅新瓶頸。
總括而言,OpenAI 呢次嘅「愛爾迪斯時刻」並唔係一個關於機器神跡嘅故事,而係一個關於信任重建嘅故事。AI 已經證明咗佢有能力跳出訓練數據嘅框架,產生真正新穎嘅邏輯推導;但同時,佢亦都證明咗,喺知識嘅殿堂入面,冇任何人可以繞過「同行評審」呢關。未來,我哋唔需要再糾結於 AI 係咪「真係識做數」,而係應該思考點樣建立一套更高效嘅人機協作驗證機制。當 AI 變得越來越聰明,人類嘅角色唔係退場,而係成為最後嘅守門人。只有當算法嘅精準同埋人類嘅判斷力結合,先至可以真正推開未知嘅大門。