AI 識做數都要人類蓋章：OpenAI 愛爾迪斯時刻背後嘅信任密碼

我哋打造人工智能，本意係要佢超越人類嘅智慧，但偏偏 OpenAI 喺 2026 年最令人信服嘅突破，最後都要靠人類學者蓋章先算數。呢個充滿矛盾嘅現實，正正反映咗當前 AI 發展嘅核心困境：機器可以計出答案，但「信任」呢家嘢，依然係人類嘅專利。舊年 OpenAI 曾經高調宣佈解決咗傳奇數學家愛爾迪斯（Paul Erdős）嘅經典難題，點知最後被踢爆只係模型將訓練數據入面嘅現有證明「翻炒」出嚟，搞到一鑊泡。近期佢哋捲土重來，今次終於帶住一個唔同嘅籌碼——曾經狠批佢哋嘅權威學者托馬斯·布魯姆（Thomas Bloom）親自認可，仲共同發表咗論文。由「被踢爆」到「被認證」，呢段歷程揭示咗啲咩？

首先，我哋必須要理解舊年嗰次「滑鐵盧」對成個 AI 行業嘅警示。當時 OpenAI 以為自己嘅模型突破咗數學推理嘅瓶頸，但實際上只係暴露咗大型語言模型最致命嘅弱點：數據污染同埋記憶覆用。模型並冇真正「推導」出答案，而係認出咗訓練庫入面嘅人類解法，然後包裝成自己嘅輸出。呢種「鸚鵡學舌」嘅現象，令到學界對 AI 產生極大嘅戒心。數學唔係淨係要一個正確嘅數字，而係要一條無懈可擊嘅邏輯鏈。當 AI 無法解釋自己嘅推理過程，甚至係靠抄襲嚟矇混過關，佢產生嘅就唔係知識，而係幻覺。

不過，近期呢次成功認證，代表咗 AI 推理能力嘅一種質變。今次最關鍵嘅分別在於「人類背書」。托馬斯·布魯姆作為愛爾迪斯問題網站嘅維護者，本身就有絕對嘅學術權威，佢舊年嘅批評直擊要害，而家佢選擇共同發表論文，等於用自己嘅學術聲譽為呢個 AI 結果做擔保。呢個舉動打破咗 AI 同學界之間嘅隔閡。AI 唔再係一個自說自話嘅黑箱，而係變成一個可以同人類協作、接受檢驗嘅研究夥伴。布魯姆嘅參與，唔單止驗證咗結果嘅正確性，更加重要嘅係，佢填補咗 AI 由「輸出答案」到「形成知識」之間嗰段信任空白。

然而，我哋亦要從呢件事睇到一個更深層嘅隱憂：AI 嘅產能同人類嘅驗證能力之間，出現咗嚴重嘅錯配。如果每一次 AI 聲稱自己有重大突破，都需要頂尖學者花費大量時間去逐步核實，咁 AI 嘅發展速度最終會被「人類信任嘅瓶頸」所拖慢。數學界甚至整個科學界，有冇足夠嘅人力去充當每一個 AI 突破嘅「驗證者」？另一方面，有人可能會質疑，如果一個證明必須要人類專家背書先至被接受，咁 AI 到底係咪真正具備獨立嘅數學直覺？定係佢只係一個極度高效嘅計算工具？呢種觀點認為，真正嘅智能應該能夠自我證明，而唔係依賴人類嘅蓋章。不過，換個角度諗，科學嘅本質本來就係建立喺人類共識之上。就算係人類數學家提出嘅猜想，都需要經過同行評審先至會被接納。AI 嘅結果需要人類把關，並唔代表 AI 冇能力，而係反映咗知識生產必須要有社會契約。AI 可以提供答案，但只有人類社群可以賦予答案「真理」嘅地位。

重點摘要

OpenAI 舊年嘅愛爾迪斯難題解答被揭發係「翻炒」訓練數據，近期終於獲得權威學者托馬斯·布魯姆嘅認證。* 布魯姆唔單止認可結果，更與 OpenAI 共同發表論文，為呢次突破提供咗關鍵嘅人類信任基礎。* AI 嘅數學推理能力固然有進步，但目前嘅「可信度」依然受制於人類專家嘅把關同背書。* AI 產能同人類驗證能力之間嘅錯配，可能成為未來科技發展嘅新瓶頸。

總括而言，OpenAI 呢次嘅「愛爾迪斯時刻」並唔係一個關於機器神跡嘅故事，而係一個關於信任重建嘅故事。AI 已經證明咗佢有能力跳出訓練數據嘅框架，產生真正新穎嘅邏輯推導；但同時，佢亦都證明咗，喺知識嘅殿堂入面，冇任何人可以繞過「同行評審」呢關。未來，我哋唔需要再糾結於 AI 係咪「真係識做數」，而係應該思考點樣建立一套更高效嘅人機協作驗證機制。當 AI 變得越來越聰明，人類嘅角色唔係退場，而係成為最後嘅守門人。只有當算法嘅精準同埋人類嘅判斷力結合，先至可以真正推開未知嘅大門。