---【 影片口白逐字稿 】---
hiho~大家好!我是志祺!今天就讓圖文不符用七分鐘的時間!
從「丁守中說單身獨居男容易犯罪」和大家一起來聊聊「大數據」吧!
-
台北市長候選人丁守中在前幾天曾經公開表示:「根據大數據分析,在社會上挫敗的人,也就是包含單身、獨居、失業等等特質的男性,會有虐童、隨機殺人的行為,應該要加強查訪,以預防犯罪」。
結果這段話很快就激起熱烈的討論,所以我們想做一集來分析這件事情,按照慣例,我們都會先收集各方觀點然後再跟大家分享我們的看法,為了要查資料,我們的企劃土龍用手機上網看了很多關於這件事的新聞,在他滑來滑去的時候,突然出現一個神秘的廣告,標題是「牽手50」,原來這是一個「熟齡交友網站」的廣告,邀請他馬上加入,和50歲的單身人士「共享人生美好的黃金歲月」。
他看到這個的時候就覺得很哭笑不得,因為他現在才20幾歲啊,照理來說是沒有熟齡交友的需求,那這個廣告到底是怎麼找上他的呢?相信大家在使用網路的過程中應該也有滿多類似的經驗,有時候網路廣告會投錯人,但有時候又非常精準,甚至準到會讓人覺得害怕。
-
【大數據侵入生活】
可能你剛剛google過一個單眼相機的配件,在拍賣網站上隨便看過幾種不同的品牌跟款式,結果之後好幾天在各個不同的網站,都會一直看到旁邊跳出這些相機配件的廣告;又或者是剛剛查過某個熱門旅遊景點的資訊,結果一堆跟住宿或飯店有關的廣告就如影隨形跑出來,主動跟你說現在有什麼優惠,可以讓您用最划算的價格找到最理想的飯店之類的。網路時代大數據跟資料演算法入侵我們生活的程度可能超乎想像,有一個最著名的故事就是,美國購物商場target竟然比少女的父親還要早知道自己的女兒懷孕了。target利用大數據來分析客戶的潛在需求,然後自動送出優惠通知折價券。有一次他們接到一個父親來電客訴:「為什麼你們一直送孕婦相關的優惠券給我女兒?她還在念高中欸」,結果過幾天後這個爸爸又打電話去道歉,因為他發現自己的女兒是真的懷孕了。
原來是因為商場他們本身就有建構自己的資料庫,他們分析這位女兒近期的購買行為,像是她買了什麼特定的乳液、香皂、保養品之類的,就判斷出這個顧客可能懷孕了,所以系統就自動發送相關優惠券給她。
雖然這個故事聽起來有點誇張,但大致來說,搞錯目標客群、送錯優惠卷這些問題還不至於有什麼道德上的衝突,但如果把大數據用來犯罪防治上,恐怕就有比較複雜的爭議跟問題了。
【丁守中被戰的原因】
以這次的新聞事件為例,用單身獨居男性這些簡單的標籤當作防制犯罪的依據,就引起激烈的反對聲浪,很多人覺得這樣的言論會誤導民眾產生「因果謬誤」,也就是讓人把「相關性」跟「因果關係」這兩個不一樣的概念混淆,最後就變成歧視。在這個案例中,造成因果謬誤的結果可能是來自於兩個原因:
1. 問錯問題
2. 資料收集不夠全面
-
【「怎麼問問題」很重要】
在數據容易紀錄也容易取得的時代,「怎麼問問題」可能是最重要的一件事。如果問對問題,大數據可以幫我們解決麻煩,但如果問錯問題,大數據可能就會誤導人做出錯誤的決策。像target商場的案例中,如果他們問的問題是「懷孕的人多半是什麼年齡、性別、職業、學歷」,那他們大概很難找出精確的潛在顧客;但如果他們把問題改成「懷孕的人平常都會買什麼」,那他們就可以藉由手中的消費紀錄去更精準地找到潛在顧客。
【資料收集要全面】
當然,要做到這些的前提是要有龐大的數據資料庫,多元、全面的數據可以提供我們更多能拿來當作參考的材料,但如果收集的數據只有年齡、性別、職業、學歷之類的基本指標,恐怕還稱不上是大數據,也很難提供參考價值夠高的答案。
-
【以《關鍵報告》來舉例預防性羈押的問題】
所以,這樣看下來,使用性別、職業之類的標籤來預防犯罪,其實好像還真的滿有爭議的。一方面是它可能本身就不夠準確,另外一方面就是,它提供的只是指標之間的「相關性」,而不是「因果關係」。但就算我們已經可以超級確定某些人就是有超高的犯罪率,這種「預防性關懷」的邏輯也還是備受考驗。就像有一部2002年的電影叫做《關鍵報告》,故事情節是2054年人類已經可以預測誰將會犯罪,所以警察就可以在犯罪發生之前就先把人繩之以法。這個方法雖然降低犯罪率,但這種「未審先判」的做法已經違背了法治的精神,也還是有可能抓錯人。我覺得這是一部很好的電影,推薦大家去看!
啊,不小心就扯遠了,總之,在證實因果關係之前就貿然使用一些標籤來預防犯罪,很容易就會讓大數據變成加深刻板印象的推手,讓一些人遭受到不必要也不友善的眼光。
-
【大數據的隱私權問題】
那麼,除了可能會造成歧視的爭議之外,大數據的另一個常見疑慮就是有隱私或人身安全方面的問題。在現在的生活中,我們已經很難過著跟大數據完全沒有瓜葛的生活,除了一些敏感機密的個人資料以外,你今天幾點起床、出門走哪一條路、跟誰出去玩…這些我們生活中的一舉一動也幾乎都被鉅細靡遺的記錄下來了。我們並不知道自己的資料到底是被誰掌控的,有可能是政府,也有可能是企業。我們無法控制自己的資料會被送到哪裡、也不知道他們會怎麼使用這些資料。
在數據資料還不發達的20世紀,許多極權政府已經能透過各種方式控制社會,在大數據發達的今日,如果政府把這些工具用來監控人民,那滲透的強度恐怕難以想像。除了政府之外,某些跨國企業有同樣有非同小可的影響力,像前陣子臉書就傳出洩漏用戶個資的醜聞,甚至影響到美國大選的結果。
【我們的觀點】
影片也即將接近尾聲,我覺得不管了不了解、喜不喜歡,大數據完全侵入我們的生活都是一個千真萬確也無法回頭的事實,它逐漸在各個領域中成為重要的趨勢,但大數據只是一個工具,比起完全依賴數據做事,更重要的是我們要學會怎麼去解讀跟使用它。-
今年初中國百度的董事長李彥宏曾說「中國人願意用隱私換取便利」,
如果真的得犧牲隱私才能換到便利或安全,你會願意犧牲哪一種隱私呢?
如果你喜歡這支影片,或是有任何想法,歡迎留言並分享出去,給更多人知道!
我們將在每週七天,每天七點,用七分鐘的時間,跟大家聊聊各式各樣有趣的生活議題!
那麼今天的志祺七七,就到這邊告一段落,我們下次再見囉!掰比!
-
【 本集參考資料 】
→大數據無往不利?重點在問題意識:https://bit.ly/2OLH5XB
→大數據巨浪來襲,有利還是有弊?:https://bit.ly/2MzCVVi
→百度談大數據,李彥宏:中國人願意用隱私換便利:https://bit.ly/2BrnolV
【 延伸閱讀 】
→凱西歐尼爾:盲目信仰大數據的時代應該要結束:https://bit.ly/2BzzpWO
→大數據一點都不大?可能誤導你的決策?破解 Big Data 的 8 個迷思:https://bit.ly/2was6ic
→王聖捷: 因大數據而失準的視野:https://bit.ly/2BstO4m
→數據、思維與成敗:https://bit.ly/2MZ3pMR