有一個下午,我請 AI 幫我分辨 Google 評論有沒有灌水。我出題,它作答:丟一家店的連結給它,讓它去讀評論的時間分布、負評的資訊量、業主回覆的誠意、評論者帳號的歷史。
考到第五家,我才發現一件我沒打算讓它知道的事—五家店裡,有四家留著我自己的評論。
我從沒打字告訴過它我什麼時候出過國,但某家燒肉店的評論時間戳告訴它了。我沒說過我的消費習慣,但每則評論底下那欄「平均每人消費金額」說了。我給分的手勢、我對服務的敏感度、我會為哪種食材多寫一句—拼起來是一張相當立體的側寫。而它甚至不是故意去查的,我只是把頁面餵進去,我的歷史就自己浮出來了。
最後一題我還特地交代:「這家我有評,你不要偷看我的答案。」它做到了不引用,但做不到沒看見—那則評論就釘在頁面最頂端。
那天起,我對「AI 時代資安」這題的想法,跟我原本讀到的主流講法分岔了。
資安、隱私這題,2025 整年被寫得很滿。主流的框架大概長這樣:把威脅排成「幾條戰線」(人臉辨識、AI 對話的記憶陷阱、行為側寫、醫療數據、物聯網),再給你一組「防護策略」(數據最小化、跟 AI 對話時用假名、定期清理對話記錄、讀懂隱私政策、主張你的法律權利)。整理得很完整,iThome 上就有寫得不錯的版本,例如 Day 10:隱私之盾 — 個資與監控的邊界。
這類文章我讀完,總覺得它抓到了「現象」,卻沒抓到那個真正「變了的東西」。它把鏡頭對準「誰在監控你、你被收集了哪些東西」,開的藥方也都是針對單一資料塊:別讓這塊外洩、把那塊清掉、這欄填假的。
可是那天下午發生在我身上的事,不是某一塊特別敏感的資料外洩。是一堆本來無害的小塊,被免費地、隨手地拼了起來。
這些資料一直都是公開的。十年前公開,二十年前的留言板也公開。那時候沒人覺得危險,因為公開不等於被看見—要把一個人散落在網路上的幾百則痕跡蒐齊、對時、拼合,工夫多到只有徵信社願意做。法律學界給這層保護取過一個名字:實務上的隱蔽(practical obscurity)。資料就在那裡,但取得成本本身就是城牆。
AI 把這道城牆的拆除費,降到了一句話。
「幫我整理這個帳號留過的所有評論,推測這個人的居住區域、作息與旅行史」—這句話現在是任何人都打得出來的 prompt。彙整成本歸零的那一刻,「公開但沒人看」這個類別就從世界上消失了,剩下的只有「公開」。
而且 AI 不只彙整你寫了什麼,它更擅長推論你沒寫的。發文時間洩漏作息,照片背景洩漏同行者,給分習慣洩漏性格,評論密度洩漏生活半徑。每一則貼文,都比作者以為的多說了三成;幾百則疊起來,多出來的那三成,就是一個完整的你。
所以個資外洩從來不是「哪一塊拼圖」的問題,是「塊數」的問題。單獨一則「梅花豬品質不錯」,無害到近乎可愛;三百則加上時間戳與座標,是一本你自己每週更新、任何人都能調閱的日記。
主流那組策略的盲點就在這裡—它們大多是單塊思維。「別跟 AI 提真名」「定期清理記錄」防的是某一塊資料外洩,但隱蔽的死法不是某一塊太敏感,是幾百塊無害小塊在彙整成本歸零後突然能被一句話接起來。用單塊的防法,打塊數的問題,當然會漏。
你可能覺得「彙整一個人」聽起來很高級,是徵信社等級的工夫。不。讓我給你看供給端現在有多廉價。
同樣在 iThome 鐵人賽,有人寫了一個訂房機器人系列,其中一篇直接叫 Day 28 飯店個資拿到手—一個業餘專案,Selenium 加 BeautifulSoup,幾十行 Python,把訂房網站上的店名、房型、價格、距離整批抓下來,再餵進一個聊天機器人吐出來。
我要講的不是那段程式碼有什麼問題(它沒有,那是很正常的爬蟲練習)。我要講的是那個標題的隨口:「拿到手」。
寫的人沒有惡意,他只是在做一個方便自己訂房的小工具。但「個資拿到手」這四個字,精準說明了今天的彙整門檻—它是一個週末作業。十年前需要徵信社的事,現在是鐵人賽第 28 天的一篇練習。
而那聲隨口,跟另一個我一直想不通的行為,其實是同一個心理。
有人會把私人開發者寫的記帳 app,直接接上自己的銀行帳戶和證券戶,授權它把交易明細整批吃進去。留評論好歹是一次給一小塊;這是把整幅拼圖裝箱寄出—資產規模、收入週期、持股、消費明細,一次到位,收件人是一個你不知道姓名、不知道伺服器在哪、不知道它倒了會不會通知你的開發者。沒有金融機構等級的資安審計,沒有外洩賠償責任,常常連授權範圍都是「全部讀取」。
我猜那個心理機制是:長得像工具的東西,感覺上不算揭露。 在評論區打字,人知道自己在「發表」;在 app 裡按下「連結帳戶」,感覺只是在「設定」;寫一支爬蟲,感覺只是在「抓取」。但資料不在乎你的感覺。它只在乎自己現在存在幾個地方、誰讀得到—而 AI 時代的修正係數是:讀得到,就拼得起來。
寫到這裡,照劇本該勸大家少留資料、退出、把欄位都填假的。但這篇偏偏不能這樣收。
因為那整個下午教我判讀評論的方法,建立在一個前提上:有人認真留了評論。
每一則評論都只是一個人當下的主觀看法,單獨看片面、甚至彼此矛盾,但匯聚起來就成了公共財。這份公共財沒有品管,真話、客套話、五星換折扣的水軍,全流在同一條河裡—所以用它的人也有自己的功課:得自己建立一套分析心法,而不是看到星星數就跟著走。
如果每個「明白風險」的人都縮回去不留,評論區就只剩下灌出來的水,那條河會死。主流策略推到極致—最小化、用假名、退出—等於是把公共財,讓給最不在乎品質的人。資安要是只剩「個人自保」,整個資訊環境會一起變差。
讓每一塊拼圖照樣有公共價值,但讓拼圖之間的接縫變鈍。
資安在 AI 時代,要防的已經不是「哪一塊不能外洩」,是「塊與塊之間能不能被免費接起來」。彙整成本歸零這件事,個人擋不住、法規追在後面跑,你唯一能調的旋鈕,是你自己留下的那些塊有多容易對齊。
你留下的每一小塊,都比你以為的大一點。在彙整成本歸零的時代,這一點點的差額,乘上幾百塊,就是別人手裡完整的你。
參考來源:
很有意思的觀點。
我覺得這篇文章提到的其實不只是隱私問題,而是軌跡問題。
過去資訊雖然公開存在,但因為分散在不同平台與不同時間點,因此很難被完整拼接。
現在 AI 不只是搜尋資訊,而是在重建一個人的長期行為軌跡。
當成本被壓縮到接近零時,真正消失的可能不是隱私,而是人們過去習以為常的「不容易被看見」。
謝謝,你這個「軌跡」講得比我原文準。我寫的時候偏在「塊數」—幾百塊拼出一張側寫,那是空間面的;你把時間軸加進來,點到我沒講清楚的地方:AI 重建的不是一張快照,是一條會延伸的線。
順著你這條再補一句(雖然有滑波我承認):靜態側寫頂多算出「你是誰」,有了長期軌跡,就有可能往前外推「你接下來會做什麼」,從描述變成預測。
樓主這個「塊數」跟「線」的比喻很好。
過去搜尋引擎比較像是在幫我們找到散落的拼圖,
現在的 AI 則開始把拼圖串成時間軸。
當系統能夠從長期軌跡推測下一步行為時,討論的可能就不再只是隱私,而是預測與影響行為的能力了。
這也讓我想到另一個方向。
如果 AI 已經能夠從人類的長期軌跡中建立側寫與預測,那麼未來擁有長期記憶與持續目標的 Agent,本身是否也會形成自己的行為軌跡?
當軌跡可以被觀察時,它帶來的是預測能力;但當軌跡無法被觀察時,它可能帶來的是漂移風險。
或許未來我們不只需要理解人的軌跡,也需要理解 AI 的軌跡。
同意,這是AI時代的新趨勢,個人認為是現在進行式,供參。
感謝您的分享,也很榮幸看到您引用我的文章。
這篇文章讓我印象最深刻的,不是「隱私正在消失」,而是您提出的另一個觀點:AI 時代真正被改變的,也許是「隱蔽性(Obscurity)」。
過去我們的資訊其實早已散落在 LinkedIn、Github、論壇發文、公司新聞稿甚至社群媒體上。問題從來不是找不到,而是沒有人願意花大量時間把這些碎片拼湊起來。但 AI 出現後,原本需要數小時甚至數天的工作,可能只剩下幾秒鐘。
這也讓我想到另一件事:很多人認為生成式 AI 最強的是寫文章、寫程式或畫圖,但我認為更強大的能力其實是**「關聯」**。它能把原本毫無關聯的資訊串聯起來,形成一個比履歷更完整、甚至比本人更容易被分析的數位分身。
而當這件事情發生後,未來最有價值的可能不再只是姓名、電話或地址等資料本身,而是資料背後的「脈絡」——包含一個人的偏好、思考模式、決策習慣與價值觀。因為這些東西,即使我們沒有明確說出口,AI 也有機會從大量碎片資訊中推論出來。
看完文章後,我反而開始思考一個問題:
如果未來每個人都能用 AI 在幾秒鐘內建立出另一個人的數位側寫,那麼我們真正需要保護的,究竟是資料本身,還是資料之間的關聯能力?
很好奇您怎麼看這個方向,也期待未來看到更多相關討論。
老實說我不是資訊相關背景,非IT或資安專業,只是一個Claude用戶,沒辦法很正確定位問題。起因來自用過Fable5做自己的小專案,又很快遇到Fabal5管制出口的問題,這幾天沒事做,就跟opus討論激發出來的想法,整理投稿這篇分享。
如果真的要我提出想法方向,個人覺得這個應該是治理層面才能解決的問題,靠個人力量要跳出這個框架的話,除非完全不上網留足跡,也不用任何AI,不然都很容易遇到這個困境。