我哋一直將 AI 當做一部超班嘅百科全書,有嘢唔識就問,佢就乖乖畀答案,我哋覺得安心,因為主導權永遠喺自己手上。但系,呢種「你問我答」嘅主從關係,正正面臨徹底嘅顛覆。我哋一面驚 AI 搶飯碗,一面又貪圖便利,將越嚟越多嘅決策權雙手奉上。當 Google 喺 I/O 2026 高調宣告「Agentic Gemini era」來臨嘅時候,我哋面對嘅已經唔係一個會聽話嘅打字機,而係一個會自己揾問題、自己解決問題嘅新物種。由「被動回應」去到「主動出擊」,呢個唔單止係技術升級,更係人類同機器互動模式嘅根本性重構。
回望過去幾年嘅 AI 發展,我哋彷彿停留喺一個「對話式 AI」嘅舒適圈入面。大家追求嘅,係模型嘅參數有幾大、生成嘅文本有幾似人、寫代碼有幾快。呢種互動模式嘅本質,依然係人類下達指令,機器執行。然而,2026年嘅今日,Google 用一場發布會告訴全世界:被動嘅 AI 已經觸及天花板,未來嘅主角係「智能體」。當 Gemini App 變得更具 Agentic 特性,能夠提供全天候、主動式嘅協助時,AI 唔再係你打開先會郁嘅工具,而係一個長駐喺你生活入面、隨時準備幫你執手尾甚至超前部署嘅大內總管。呢種轉變,令 AI 從一個「知識庫」進化成一個「執行者」。我哋必須正視一個現實:當 AI 識得自己郁,人類嘅角色同埋責任邊界,到底應該點樣重新劃定?
要理解呢場變革嘅深度,我哋必須拆解 Google 喺 I/O 2026 發布嘅呢套組合拳。今次嘅重點唔係單一模型嘅跑分有幾高,而係一整套為「智能體時代」度身訂造嘅基礎設施。首先系 Gemini Omni 嘅登場,呢個名字本身就揭示咗全方位、無孔不入嘅意圖。佢唔再局限喺某個特定介面或者單一應用場景,而系作為一個底層嘅感知中樞,貫穿用戶嘅數碼生活。更重要嘅系,Google 明確指出 Gemini App 將變得更具 Agentic 特性,提供 24/7 嘅主動幫忙。所謂「主動」,意味住系統背後需要持續嘅狀態感知同埋決策運算——佢唔系等你問「聽日天氣點」,而系根據你嘅日程同行蹤,主動話你知「聽日落雨,你下晝嘅戶外會議建議改室內或者延期」,甚至幫你直接發出修改日程嘅請求。
對於開發者而言,Google 今次落咗重注,喺 Gemini API 引入咗 Managed Agents。呢個舉動嘅戰略意義極其深遠。以前要搞一個識得自己諗辦法嘅 AI Agent,開發者需要自己搭建複雜嘅狀態機、處理記憶管理、錯誤重試等等繁瑣嘅底層邏輯。而家 Google 將呢啲全部封裝成「託管智能體」服務,等開發者可以專注喺設計智能體嘅行為同業務邏輯。呢個就好似早期雲計算普及咁一樣,大幅降低咗創新嘅門檻。再配合具備前沿智能同行動能力嘅 Gemini 3.5,呢個模型正正就係呢啲智能體嘅超級大腦。Gemini 3.5 嘅突破唔單止喺於理解力,更在於佢強大嘅 Action Capabilities——將複雜指令拆解為可執行步驟,並且調用外部工具完成任務嘅能力。最後,Gemini Embedding 2 嘅全面可用,則為呢個生態提供咗最扎實嘅記憶同檢索基礎。冇好嘅 Embedding,智能體就等同失憶,根本無法喺龐大嘅資料海入面精準揾到行動依據。呢一連串嘅發布,環環相扣,目標直指「智能體時代」嘅霸主地位。
第一個維度:技術範式嘅根本轉移——由「大語言模型」走向「大行動模型」
過去幾年,AI 行業捲參數、捲算力,目標都係令模型「講得出」正確答案。我哋習慣咗用 Benchmarks 去衡量一個模型嘅智商,但 Gemini 3.5 嘅出現,標誌住競賽嘅核心已經由「認知力」轉向「執行力」。一個識得作詩嘅 AI,同一個識得幫你訂機票、安排行程、甚至自動處理工作郵件嘅 AI,係兩個完全唔同嘅物種。5 強調嘅 Action Capabilities,意味住模型內部已經進化出一套更成熟嘅規劃同執行機制。佢唔單止要「識講」,更要「識做」。
呢種由「生成」到「行動」嘅跳躍,就好似一個識得背書嘅書生,變成一個識得辦事嘅大管家。喺技術層面,呢個轉變要求模型具備更強嘅多步推理能力、更穩定嘅工具調用接口,以及更魯棒嘅錯誤修正機制。當 AI 真正落手落腳去做嘢時,容錯率會變得極低。寫錯一行字可以改,但係如果轉賬轉錯戶口或者發錯一封撤回要約嘅郵件,後果不堪設想。因此,Gemini 3.5 所謂嘅 Frontier Intelligence,唔再僅僅係考試分數有幾高,而係佢喺複雜現實環境中,面對模糊指令同突發狀況時嘅行動穩健度。呢個範式轉移,將會逼使所有 AI 廠商將研發重心從單純嘅文本生成,轉移到如何令 AI 喺真實世界入面可靠咁執行任務。未嚟衡量一個模型嘅標準,將會係佢可以連續正確完成幾多個 Action,而唔係佢可以生成幾長嘅文章。
第二個維度:開發者生態嘅重構——由「寫代碼」走向「管智能體」
Google 今次推出嘅 Managed Agents,絕對係一招影響深遠嘅妙棋。喺智能體時代,開發者面對嘅最大痛點唔係模型唔夠聰明,而係要花大量時間去處理智能體嘅「生存問題」。一個長期運行嘅智能體,需要持續嘅狀態保持、長期記憶管理、遇到 API 限制時嘅降級處理,甚至係多個智能體之間嘅協作同通訊。呢啲底層嘅髒活累活,以往需要開發者自己從零開始搭建,導致好多有創意嘅 Agent 應用胎死腹中。
Google 將呢啲底層邏輯封裝成託管服務,等同於為開發者提供咗一個現成嘅「智能體操作系統」。開發者嘅角色,將會由傳統嘅「代碼編寫者」,轉變為智能體嘅「教練」或者「管理者」。你唔需要再逐行定義每個步驟嘅代碼邏輯,而係設定目標、劃定行為邊界、提供反饋機制。呢種開發模式嘅轉變,必然會催生出一大批基於 Gemini 嘅智能體應用。想像一下,未嚟嘅 App Store 入面,賣嘅唔再係一個個靜態嘅功能 App,而係一個個具備唔同專業技能同性格嘅 Agent。有專門幫你炒股嘅 Agent,有專門幫你篩選簡歷嘅 Agent,甚至有專門幫你處理社交禮儀嘅 Agent。當最好用嘅智能體都跑喺 Gemini 嘅軌道上,Google 就掌握咗下一代互聯網嘅流量入口同埋底層標準。呢個先發優勢,一旦建立,對手好難追趕。
第三個維度:用戶交互體驗嘅質變——由「命令-回應」走向「授權-監督」
我哋一直習慣咗嘅人機互動,係「命令-回應」模式。你輸入一個 Prompt,AI 畀你一段文字或者一幅圖。呢種模式嘅好處係,人類擁有絕對嘅控制感。但當 Gemini App 變得更具 Agentic 特性,提供 24/7 主動幫助時,呢種舊有模式就徹底破產咗。試想像下,你嘅手機入面嘅 AI,唔再係等你問嘢,而係主動彈出嚟話:「我留意到你下個禮拜有個去東京嘅行程,我已經幫你比較咗唔同航班嘅價格同時間,並且根據你嘅日程預留咗會議前後嘅空檔,你係咪確認訂票?」
呢種由被動變主動嘅轉變,對用戶嚟講係極大嘅便利,但同時亦係極大嘅心理衝擊。用戶需要適應一個「會自己郁」嘅助手。喺呢個過程入面,信任感嘅建立至關重要。如果 AI 嘅主動行為偶爾出錯,例如訂錯餐廳、發錯電郵,用戶嘅反彈會比以前更大。因為以前係你自己下錯指令,責任在你;而家係 AI 自作主張,責任在機器。因此,未嚟嘅 UX 設計,核心將會係「授權機制」嘅設計。如何喺「主動幫忙」同「尊重用戶決定」之間揾到平衡?如何讓用戶覺得 AI 係喺度「幫手」而唔係「越權」?呢個係所有 AI 產品未嚟必須解決嘅難題。Gemini 嘅轉變,其實係將 AI 從一個工具,提升到一個「合作夥伴」嘅位置。但呢個夥伴有幾大嘅自主權,正正係而家最模糊、最需要探索嘅地帶。一旦授權過多,可能引發災難;授權過少,又會令智能體變回一個殘疾嘅聊天機器人。呢條鋼線,Google 必須小心翼翼咁行。
呢條鋼線,唔單止係用戶體驗(UX)設計嘅挑戰,更係成個科技行業商業模式同生態系統嘅重塑。當 AI 跨越咗被動回應嘅門檻,主動走入我哋嘅生活,我哋必須從更多維度去解構呢場變革帶嚟嘅深層影響。
首先,從生態系統嘅維度嚟睇,Google 嘅優勢在於佢哋擁有極度龐大嘅服務網絡——Gmail、Calendar、Maps、Docs 等等。呢啲唔係冰冷的數據庫,而係用戶每日生活嘅軌跡。當 Gemini 從一個對話框走出嚟,變成一個能夠跨應用操作嘅智能體時,佢嘅破壞力同創造力都係指數級嘅。想像下,以前你喺搜尋引擎搵餐廳,再自己打電話訂位;而家 Gemini 直接幫你發電郵確認,仲加埋行事曆提醒,甚至通知你嘅朋友。呢種無縫銜接,係其他只做模型而缺乏應用場景嘅初創公司難以企及嘅。然而,呢個亦帶嚟咗商業上嘅根本矛盾:傳統搜尋引擎嘅商業邏輯係建基於「用戶停留同點擊廣告」,但當 AI 幫你搞掂一切,用戶根本唔使再點擊任何連結。代理式 AI(Agentic AI)本質上係消滅中間過程,而廣告正正就係依賴呢個過程嚟生存。Google 點樣喺「幫用戶慳時間」同「自己賺廣告費」之間揾到新嘅變現模式,係 2026 年最值得關注嘅商業博弈。
另一方面,競爭對手嘅策略亦反映出呢條鋼線嘅難度。例如 Apple 嘅智能整合傾向保守,強調設備端運算同明確嘅用戶授權,寧願慢啲都唔好越權;而 OpenAI 則嘗試透過開放第三方插件去構建生態,但往往因為介面碎片化而令用戶無所適從。Google 試圖喺兩者之間揾到一個甜蜜點:既要有大膽嘅主動行為,又要確保授權機制唔會煩到用戶。但呢個平衡點極度脆弱。一旦授權介面設計得太多確認按鈕,用戶會覺得煩厭而關閉功能;一旦授權過於寬鬆,又會引發類似「自動發送奇怪電郵畀老闆」嘅公關災難。
再者,私隱界線變得前所未有咁模糊。一個被動嘅搜尋引擎唔需要知道你下個禮拜嘅行程,但一個主動嘅智能體必須要掃描你嘅電郵、日程甚至通訊錄,先可以做出合理嘅建議。用戶數據嘅收集從「主動提供」變成「被動讓渡」。呢種讓渡係建立代理能力嘅前提,但亦係踩單車踩向懸崖嘅危險動作。當 AI 可以代你行動時,佢嘅數據存取權限就等同於你嘅生活控制權。一旦出現數據濫用或外洩,對品牌信任嘅打擊將會係毀滅性嘅。所以,我哋見到嘅唔係單純嘅技術升級,而係一場牽涉商業邏輯、私隱倫理同人機關係嘅全面革命。
從 2026 年上半年嘅行業數據觀察,我哋可以清晰睇到呢種轉變帶嚟嘅震盪。各大雲端平台嘅 API 調用分佈出現咗結構性轉移:傳統嘅對話式查詢 API 佔比開始下降,而觸發外部工具同埋多步驟執行嘅代理式 API 調用則直線上升。呢個數據反映,開發者已經唔再滿足於 AI 淨係識得傾偈,而係要佢真正落手做嘢。然而,用戶行為數據亦揭示咗一個隱憂:喺具有「自動執行」功能嘅 AI 產品入面,用戶嘅「撤銷率」同埋「干預率」喺初期高得驚人。即使 AI 嘅決策正確率已經相當之高,用戶依然傾向喺最後一步親自撳落去確認。呢個現象說明咗兩件事:第一,人類對失去控制權嘅恐懼係根深蒂固嘅;第二,AI 嘅決策過程依然太似一個黑盒,用戶無法理解「點解」AI 會做出呢個選擇,所以只能靠人手把關。
更值得留意嘅係所謂嘅「授權疲勞」現象。當 AI 每隔幾分鐘就彈出一次詢問「是否允許存取行事曆」、「是否允許代發電郵」,用戶好快就會因為嫌煩而習慣性咁撳「允許」。呢種疲勞反而令原本用嚟保障用戶嘅授權機制形同虛設,將系統暴露喺更大嘅風險之下。同時,數據流量嘅分佈亦反映咗生態系統嘅馬太效應:能夠串連多個應用場景嘅大型科技平台,其用戶活躍度同埋留存率遠遠拋離單一功能嘅 AI 工具。因為用戶需要嘅唔再係一個識得傾偈嘅打字機,而係一個識得喺唔同 App 之間穿梭辦事嘅管家。呢啲數據唔單止係冰冷嘅統計,更係人類適應新物種嘅心理軌跡,記錄住我哋喺信任同懷疑之間嘅反覆橫跳。
重點摘要:
- 從被動回應到主動介入:Gemini 等智能體正帶領 AI 跨越「問答」階段,進入「代勞」時代。呢個轉變唔只係功能升級,而係人機互動範式嘅根本轉移,要求用戶重新適應一個會自作主張嘅數碼夥伴。* 授權機制嘅核心矛盾:AI 自主權過大會引發越權危機同公關災難,過細則打回原形變成殘疾工具。點樣設計精細嘅授權階梯,避免「授權疲勞」,係未來 UX 嘅重中之重。* 生態圈嘅降維打擊:擁有完整應用生態(如郵件、地圖、文檔)嘅科技巨頭,喺代理式 AI 嘅競爭入面擁有絕對優勢。單一模型將難以匹敵,生態整合能力成為核心壁壘。* 商業模式嘅自我顛覆:代理式 AI 消滅咗用戶嘅中間過程,傳統依賴點擊同停留嘅廣告模式面臨解體。點樣喺幫用戶搞掂嘢嘅同時賺錢,係科技巨頭必須解開嘅生死題。* 私隱讓渡嘅新常態:主動式 AI 必須建立喺全面掃描用戶數據嘅基礎上,數據收集從「主動提供」變成「被動讓渡」。私隱紅線面臨前所未有嘅挑戰,信任基礎極度脆弱。
當 AI 識得自己郁,我哋正面對嘅其實唔係一個技術問題,而係一個關於人類自主權嘅哲學命題。過去,我哋將工具視為手臂嘅延伸,鋤頭唔會自己掘地,計算機唔會自己按數字。但而家,呢個延伸突然生咗腦,識得判斷邊度有地需要掘。我哋將日常決定嘅「否決權」交咗畀一個算法,呢種信任嘅轉移係極其脆弱嘅。一旦 AI 喺某個關鍵決定上同用戶嘅價值觀產生衝突,例如 AI 認為平靚正嘅航班時間係清晨五點,但用戶重視睡眠質素;又或者 AI 幫你回覆咗一封語氣過於官方嘅電郵畀親友,呢種衝突就會瞬間撕裂信任嘅橋樑。
我哋必須認清,AI 成為「合作夥伴」呢個講法,目前依然帶有強烈嘅擬人化浪漫。佢唔係一個有血有肉嘅夥伴,而係一個擁有超級計算力但缺乏常識同情感嘅執行者。喺呢個過渡期,人類必須要學識做一個合格嘅「管理者」,而唔係依賴者。我哋需要建立一套全新嘅溝通語言,唔再係簡單嘅指令輸入,而係目標同底線嘅設定。只有當我哋清晰知道自己嘅底線喺邊,先可以避免 AI 喺為我哋「好」嘅過程入面,不知不覺咁蠶食咗我哋嘅生活主導權。畢竟,一個唔使你開口就幫你搞掂一切嘅管家,同埋一個軟禁你嘅獄卒,有時只係一線之差。
展望未嚟,2026 年只係代理式 AI 嘅元年。當單一用戶嘅 AI 智能體開始普及,下一步就係「智能體之間嘅交涉」。你嘅 AI 同我嘅 AI 計價還價,幫你哋安排最啱嘅會議時間;你嘅理財 AI 同銀行嘅 AI 系統博弈,爭取最好嘅匯率。到咗嗰個時候,人類可能連「授權」呢個動作都會交托畀 AI,進入一個真正自動化嘅數碼共生時代。我哋準備好未呢?