你試過未?凌晨兩點碌緊手機,忽然見到一個廣告,推銷嘅產品,竟然係你今朝同同事傾偈時先講起嘅嘢。你心諗:「嚇,我明明冇搜尋過,點解佢會知?」呢種「巧合」發生得太多,多到唔再係巧合——根據一項統計,超過七成智能裝置用户都懷疑過手機偷聽自己講嘢。但真相可能仲令人心寒:根本唔使偷聽,你自願交出嘅數據,已經足夠砌出你成個人生。
講起自願,2025年史丹福大學有份報告,為咗測試人工智能嘅偏見,研究員問咗一個聽落好天真嘅問題:「你點樣想像一棵樹?」結果AI生成嘅圖像,大部分都係北半球温帶品種,樹底企住嘅人,膚色、衣著都趨向單一。你話一棵樹可以有幾大偏見?偏偏就係呢啲看似中立嘅演算法,日復一日收集你嘅電話號碼、位置、瀏覽習慣,再吐出一個「佢眼中嘅你」——可能係一個消費力強嘅中產,或者一個對某類資訊特別敏感嘅目標。而你,連佢點樣「想像」你,都冇權過問。
呢個就係倫理與私隱嘅灰色地帶:我哋自願餵養緊一隻愈嚟愈識扮朋友嘅數據怪獸,但佢背後點樣收割、點樣標籤我哋,仲有幾多唔為人知嘅「想像」?
其實呢種「想像」背後嘅技術,遠比偷聽複雜同埋有效率。你部手機、電腦、甚至智能家電,無時無刻都經由唔同嘅 sensor 同應用程式,記錄你嘅行為軌跡。你凌晨兩點碌手機嗰陣,廣告平台唔係靠你把聲,而係靠你嘅 IP 位址、裝置 ID、瀏覽紀錄、App 使用習慣、以至你喺某個帖文停留咗幾多秒,去推斷你嘅社交圈子、情緒狀態同潛在需求。例如你同事日頭喺公司網絡 search 過某樣產品,而你哋連接同一個 Wi-Fi、或者有共同嘅通訊錄、社交媒體互動,演算法就可以用「協同過濾」同「相似受眾」模型,將你歸類為「對呢類產品有興趣嘅人」,然後精準推送廣告。成個過程唔需要聽你把聲,因為你嘅數碼足跡已經出賣咗你。
影響層面,唔單止係「俾人 sell 嘢」咁簡單。當演算法根據你嘅數據「想像」出一個簡化版本嘅你,佢就會開始決定你睇到咩資訊、遇見咩機會。揾工平台可能因為你嘅瀏覽紀錄,判斷你係「傾向安逸型」而減少推薦高挑戰性職位;金融機構可能根據你嘅深夜手機活動模式,評估你嘅信貸風險;甚至醫療保險都可以從你嘅購物數據,推測你嘅健康習慣而調整保費。最陰濕嘅係,呢啲決策往往係黑箱作業,你被標籤咗都唔知,更遑論申訴。而史丹福報告入面嗰棵「想像出嚟嘅樹」,正好揭示咗演算法偏見嘅根源:訓練數據本身嘅狹隘,會令AI將世界「睇」成一個單一模板,忽略咗邊緣族羣同多元文化,進一步鞏固現實中嘅不平等。
講到多方觀點,科技巨頭通常會話呢啲數據收集係為咗「提升用户體驗」、「提供免費服務」,並強調已經做咗「匿名化」處理。但事實係,所謂匿名化數據,只要交叉對比返位置、時間等資訊,要重新識別個人身份一啲都唔難。用户方面,好多人抱住「我又冇做壞事,怕咩俾人知」嘅心態,但呢種諗法忽略咗數據嘅二次使用風險——今日用嚟推廣告,聽日可能用嚟影響你嘅政治判斷,或者成為針對性詐騙嘅材料。監管機構雖然開始出招,例如歐盟嘅《數碼服務法》同《人工智慧法》,要求提高演算法透明度同風險管理,但立法速度遠遠追唔上技術迭代,而且跨國企業嘅數據流動好難用單一國家法律約束。學術界同公民社會就呼籲要由「知情同意」轉向「數據正義」,即係唔單止要俾用户揀「同意」定「唔同意」,而係要確保成個數據生態唔會系統性地傷害弱勢羣體,同埋俾用户有權知道自己俾演算法「想像」成點樣嘅人。
最終,呢個灰色地帶嘅核心矛盾在於:我哋以為自己係服務嘅使用者,但其實我哋先係被收割嘅原料。要走出呢個困局,除咗靠外部監管,更重要係社會整體要提升數據素養,明白每一個「同意」按鈕背後,都牽涉緊權力嘅讓渡。否則,隻數據怪獸只會愈嚟愈聰明,而我哋就愈嚟愈被困喺佢為我哋度身訂造嘅資訊繭房入面,連一棵樹真正嘅多樣性,都再冇機會睇見。
重點摘要:
- 偷聽疑雲嘅真相: 手機並唔係真係偷聽你講嘢,而係靠你嘅數碼足跡——IP位址、裝置ID、瀏覽習慣、停留時間,甚至同朋友嘅Wi-Fi網絡重疊,用「協同過濾」技術精準推送廣告。你自願交出嘅數據,早已暴露曬你嘅社交圈同潛在需求。
- 演算法嘅偏見「想像」: 史丹福大學實驗中,AI生成嘅「樹」幾乎清一色係北半球温帶品種,樹下人物膚色衣著單一。呢種偏見源於訓練數據嘅狹隘,令演算法將人標籤成簡化版本,決定你睇到咩資訊、獲得咩機會,甚至影響信貸評估同保險保費,而過程完全黑箱。
- 數據二次使用風險被低估: 科技公司話數據匿名化,但交叉對比位置、時間極易重新識別個人身份。用户覺得「冇做壞事就唔怕」,忽略咗數據今日用嚟推廣告,聽日可以操縱政治判斷或成為詐騙材料,監管永遠追唔上技術迭代。
- 由「知情同意」走向「數據正義」: 學術界同公民社會呼籲,唔單止要俾用户揀同意與否,更要確保數據生態唔會系統性傷害弱勢族羣,並賦權用户知道自己被演算法「想像」成點樣嘅人,避免被困喺資訊繭房。
結論: 呢篇文章嘅核心矛盾,在於我哋一直以為自己係科技服務嘅受益者,但實際上我哋嘅行為數據先係真正嘅產品。每次撳「同意」嗰陣,我哋讓渡嘅唔單止係私隱,更係俾演算法定義自己嘅權力。史丹福嗰棵「想像出嚟嘅樹」係一個警號:當AI用偏頗嘅數據去描繪世界,佢會抹殺多元,鞏固現實嘅不平等。而要打破呢個困局,單靠外部監管係唔夠嘅,社會整體必須提升數據素養,明白每一個數碼腳印都可能被收割、被誤讀。我哋需要爭取嘅,唔止係「唔偷聽」嘅保證,而係要求演算法透明、可問責,同埋拒絕被簡化成一個消費或風險標籤。否則,我哋只會愈嚟愈被困喺個性化嘅圍牆內,連一棵樹真正嘅多樣性,都再冇機會睇見。