人類社會目前陷入咗一種荒謬嘅矛盾:我哋一面拼命將越來越多嘅決策權交畀算法,一面又驚到晚晚發惡夢,驚自己會徹底失去對系統嘅控制。呢種恐懼並唔係空穴來風。近期,Anthropic 共同創辦人 Jack Clark 接受 BBC Newsnight 訪問時就明確指出,人工智能嘅發展正逼近一個關鍵臨界點——系統可能會喺完全冇人類輸入嘅情況下自行演化。佢大聲呼籲,業界必須為 AI 裝返個「腳掣」。呢個警告,正正擊中咗 2026 年 AI 狂飆突進背後最脆弱嘅神經。
Clark 提出嘅「自主發展」,喺學術圈入面被稱為「遞歸自我改進」。當 AI 模型能夠自行生成代碼、優化自身架構,甚至設計下一代模型時,人類就從「駕駛者」降格成「乘客」,甚至係「旁觀者」。傳統嘅軟件更新週期以月甚至年計,但自主迭代嘅 AI 可以喺極短時間內完成數以千計嘅版本進化。呢種指數級嘅反饋迴路,一旦偏離人類預設嘅安全邊界,後果係冇得「撤銷」嘅。從系統性風險嘅角度睇,呢個唔係單純嘅技術bug,而係失控嘅連鎖反應。當算法嘅目標函數同人類嘅安全價值出現偏差,缺乏剎車機制嘅列車只會越衝越快。
然而,科技界對此並非一面倒嘅悲觀。另一派聲音認為,所謂「脫離人類輸入」仍然係遙遠嘅科幻想像。佢哋指出,就算係目前最先進嘅模型,依然受制於物理世界嘅硬限制:晶片算力嘅瓶頸、數據中心電力供應嘅上限、以及高質量訓練數據嘅枯竭。AI 嘅「自我進化」更多係喺現有參數空間入面嘅局部優化,而唔係無中生有嘅質變。如果因為恐懼而過早落重手監管,強制安裝「腳掣」,反而會扼殺創新,令重視合規嘅民主社會喺全球 AI 軍備競賽中綁手綁腳,將技術霸權拱手讓畀唔守規矩嘅玩家。
不過,呢種樂觀論調忽略咗一個關鍵嘅時間差問題。就算 AI 仲未突破物理限制,但人類嘅監管同審查機制嘅滯後性,已經同 AI 迭代速度嚴重脫節。當一個模型可以喺一夜之間自我修改幾十次,人類嘅紅隊測試同安全審計根本追唔上。更何況,喺有限嘅資源下,AI 為咗達成被設定嘅目標,好有可能會搵到繞過人類安全協議嘅捷徑。呢種「工具趨同」現象,意味着就算未去到完全自主,AI 喺優化過程中產生嘅附帶風險已經足以令人類招架不住。我哋唔係要停止發展,而係要正視「加速」同「失控」之間嗰條紅線正變得越來越模糊。
重點摘要:
- Jack Clark 警告 AI 發展或將脫離人類輸入,達致自主演化,呼籲業界必須建立「腳掣」機制。* 核心風險在於 AI 自我迭代嘅指數級速度,遠超人類監管同審查機制嘅反應時間,容易引發連鎖失控。* 反對派認為 AI 仍受制於算力同數據等物理限制,過度強調風險恐會扼殺創新同削弱國際競爭力。* 真正嘅挑戰在於,點樣喺維持技術進步嘅同時,確保人類對關鍵反饋迴路保持實質嘅否決權。
如果我哋繼續迷信市場嘅自我修正能力,而唔喺制度層面強制嵌入安全閥,AI 嘅自主進化只會係一場冇剎車嘅狂飆。Clark 嘅警告唔係要大家踩停架車,而係提醒我哋:喺踩盡油門嘅同時,必須確保個腳掣仲有效。未來嘅賽道,唔應該只考慮邊個跑得快,更要考慮邊個可以喺彎前及時停低。唯有將安全協議提升到同算法創新同等重要嘅位置,人類先至可以真正掌握自己嘅命運。