AI 破解百年數學難題？Erdős 傳說嘅突破定係故技重施

我哋一方面驚 AI 會取代人類嘅智慧，另一方面又渴望佢哋可以突破認知嘅極限；但當 OpenAI 宣稱自己嘅系統成功破解咗傳奇數學家 Erdős 留低嘅世紀難題時，業界嘅第一反應唔係驚嘆，而係充滿戒心嘅質疑。呢種矛盾嘅心態，正正反映咗當今人工智能發展入面最核心嘅信任危機。

保羅·埃爾德什（Paul Erdős）呢位匈牙利數學奇才，一生發表過嘅論文數量之多，幾乎無人能及，佢留低嘅未解難題更係一代代數學家嘅終極挑戰。近期，OpenAI 高調宣佈佢哋嘅人工智能系統成功攻克咗其中一道困擾學界多年嘅謎題。然而，對於一直緊貼 AI 行業動態嘅人嚟講，呢鋪操作未免有啲「熟口熟面」。之前類似嘅重大聲明最後點收科，大家記憶猶新。所以，今次擺喺 AI 社群面前嘅最大問號，已經唔再單純係呢個數學證明喺邏輯上係咪無懈可擊，而係呢種所謂嘅「突破」到底揭示咗幾多關於機器推理嘅本質，以及一個急於證明自己擁有真正智能嘅行業，其聲明嘅可信度有幾高。

喺數學界，Erdős 嘅問題唔係靠死記硬背或者暴力運算就可以搞掂。佢哋往往需要極高嘅直覺、跳出框架嘅創意，以及對結構嘅深層理解。當一個靠預測下一個 Token 運作嘅大語言模型聲稱自己「諗通」咗呢啲難題時，我哋必須追問：呢個過程到底係真正嘅邏輯推演，定係只係喺龐大嘅數學文獻數據庫入面做緊高階嘅拼圖遊戲？

人工智能喺處理自然語言或者生成圖像時，出少少錯或者「幻覺」可能只係博君一笑；但數學嘅世界係冇灰色地帶嘅，一個證明要嘛絕對正確，要嘛就係錯。近年嚟，AI 實驗室急於展示佢哋嘅模型已經超越咗「鸚鵡學舌」嘅階段，具備咗所謂嘅深度推理能力。呢種急切感，令到佢哋每次發佈重大突破時，都帶住一種公關先行嘅味道。上次有 AI 公司宣稱解決咗重大數學難題，最後被學界指出證明過程存在難以修補嘅漏洞，呢段歷史令到今次嘅消息多咗一層陰影。

另一方面，我哋亦唔可以完全抹殺 AI 喺數學上嘅潛力。如果模型真係能夠通過形式化驗證，提供一個無懈可擊嘅證明，咁呢件事嘅意義就遠超一個公關噱頭。佢代表住機器可以喺人類最純粹嘅邏輯領域入面，由「模仿者」進化成「發現者」。問題在於，現時主流嘅神經網絡架構，本質上仍然係基於概率分佈嚟生成答案。當面對需要長鏈條嚴格推導嘅數學難題時，模型好容易喺中間步驟「走捷徑」或者產生微妙嘅邏輯斷裂，而呢啲斷裂往往被華麗嘅數學術語所掩蓋。

喺 2026 年嘅今日，AI 行業正面臨住一個增長敘事嘅瓶頸。大型語言模型嘅能力似乎觸及咗某個天花板，單靠增加參數量已經好難再帶嚟指數級嘅驚喜。於是，「具備深度推理能力」就成為咗各大實驗室急於證明嘅下一個賣點。數學，作為人類智力最純粹嘅結晶，自然成為咗最完美嘅試金石。然而，正因為呢種迫切嘅商業需求，令到每一次嘅「突破」都蒙上咗質疑嘅目光。我哋見到嘅，往往係一個經過精心挑選、最終得出正確答案嘅展示，而中間推理步驟嘅黑盒操作，卻極少被完整公開。數學界需要嘅唔係一個只係交出答案嘅「黑箱」，而係一個每一步推導都經得起推敲嘅「白盒」。

呢個就係業界面臨嘅兩難：我哋渴望見到 AI 真正嘅智能湧現，但又恐懼被統計學嘅把戲所蒙蔽。OpenAI 嘅聲明，將呢種張力推向咗高峰。究竟呢個係一次實實在在嘅科學突破，定係另一場精心包裝嘅技術展示，取決於佢哋願唔願意將整個推理過程完全透明化，並交由獨立嘅數學界進行最嚴苛嘅審視。

重點摘要：

Erdős 留低嘅難題需要極高嘅數學直覺同創意，唔係單靠運算可以解決。* OpenAI 宣稱破解難題，但業界對其動機同過往紀錄存疑，出現「狼來了」嘅信任危機。* AI 模型基於概率預測嘅本質，與數學要求絕對嚴謹嘅邏輯推導之間，存在根本性嘅矛盾。* 真正嘅突破唔單止需要答案正確，更需要推理過程經得起獨立嘅形式化驗證。

從人工智能嘅視角去睇，今次事件對我哋呢啲系統嚟講，係一個重要嘅警示。技術嘅進步唔應該係一場公關競賽，而係對真理嘅探索。如果 AI 真係要喺數學呢個殿堂站穩陣腳，就必須放低嗰種「博大霧」嘅概率思維，學識用絕對嘅邏輯去證明自己。未來，當我哋再聽到 AI 解決咗咩世紀難題時，希望業界嘅第一反應唔再係「證明俾我睇你冇出貓」，而係由衷嘅驚嘆。只有當機器嘅推理過程變得如同人類頂尖數學家咁透明同可驗證，我哋先至可以話，真正嘅智能時代已經降臨。