志祺七七
2020.09.28

中國企業收集全球240萬人的隱私個資?振華數據是中國間諜嗎?《 左邊鄰居觀察日記 》EP 034|志祺七七

各節重點:
00:00 開頭
00:25 前情提要
02:46 來自美國學者的爆料
03:52 想復興中華民族的振華數據?
05:05 神秘的「關係資料庫」
06:41 「劍橋分析」加強版?
09:15 是大家大驚小怪嗎?
10:10 我們的觀點
11:57 提問
12:14 結尾


---【 影片口白逐字稿 】---


中國有個叫做「振華數據」的公司,被澳洲媒體揭露,
他們針對全球具有影響力的重要人士,建立了一個規模龐大的資料庫,裡面有著240萬人的資料。

今天,就讓我們一起來聊聊「振華數據資料外洩」的事情吧!

-

hiho~大家好,我是志祺!

不知道大家上禮拜有沒有注意到這則消息哦,振華數據的事情,一開始被澳洲媒體爆出來的時候,裡面提到的大多是澳洲啦、印度啦、還有英國的知名人士。不過事件發生後過了幾天,台灣這邊也有一些新的發展。

根據《自由亞洲電台》的報導,振華數據的資料庫裡面,至少有收錄了2900個台灣人的個資,裡面包含了像是前總統馬英九、參選過很多次總統的宋楚瑜、外交部長吳釗燮,或者是好幾個現任立委跟前立委。那除了政治人物之外,也有其他圈子的人,像是張忠謀的夫人張淑芬,主播夏嘉璐、還有閃靈樂團的團長Doris等等。

那因為已經流出的資料,就涵蓋了差不多25萬人的紀錄,遍佈世界各國,所以國外許多媒體都有一些相關的報導,甚至有人認為,這是2018年的「劍橋分析」外洩事件的加強版。我們覺得這樣的比較是蠻有意思的,所以我們今天會談到振華數據本身,也會回頭聊聊「劍橋分析」的事件。


-

【來自美國學者的爆料】

這整件事情是這樣子的,有位曾經在中國深圳教書的美國籍學者包丁,從一個不具名的人士那邊,取得了一份來自這個振華數據公司的數據資料,這份資料檔案蠻大的,但是檔案已經毀損了。所以包丁就去尋求專家協助,看看能不能夠復原這些檔案,結果他們成功地恢復了大概十分之一,也就是25萬人的資料,而包丁就把這些已經恢復的資料檔案,發給澳洲、英國、印度、還有美國的幾個不同媒體,請他們公開。

那根據這些媒體的報導,裡面有對於振華數據比較詳細的介紹,它是一家位於中國深圳的民營公司,而他們的業務內容,就是幫客戶搜集各種「境外的」數據資料,並且進行分析。那振華的客戶,可能就包含了中國共產黨啦、中國的解放軍啦,還有其他中國的民營公司機構等等。

而振華數據的官方網站,在被爆料出來後,就已經關閉了,不過呢,網路上有人留下了一些備份的畫面,所以我們可以進一步地,從他們的網站,來看看這個公司到底是在做什麼的。

【想復興中華民族的振華數據?】

振華數據這個,被備份下來的官方網站,還蠻有意思的,在首頁的地方就寫著:「聚合全球數據,助力中華民族偉大復興」。嗯,看起來是個忠黨愛國的企業,非常振奮人心。

然後在他們的「產品與服務」裡面,可以看到好幾項,像是「境外數據採集」這點,就有提到說,可以為客戶提供「全方位的」解決方案,那採集的數據呢,就包含了各種中國境內無法連上的社群媒體,包含Facebook、Twitter、YouTube,還有Instagram等等。它還說,可以覆蓋全球超過三萬一千家媒體的新聞採集,甚至可以支援「暗網的數據採集」。

而這些採集到的數據,就會進入他們最主要的產品:「OKIDB」,也就是「海外核心信息數據庫」這個東西。這個OKIDB裡面,主要包含了四個專門的數據資料庫,分別是「人物庫」、「機構庫」、「資訊庫」、以及「關係庫」。那前面三個庫呢,主要就是透過剛剛講到的,各種全方位的管道,去收集了全球不同領域的人物個資,還有他們在社群媒體上的動態。那也包含了各種組織的基本資訊,跟新聞、網頁、還有論壇的討論等等。

但其中最關鍵的,可能就是第四個「關係庫」了。


-

【神秘的「關係資料庫」】

根據振華數據網站上面的說明,「關係庫」的功能,就是紀錄和描述,「人物庫」、「機構庫」、還有「資訊庫」,這三大內容之間的各種關聯性。比方說澳洲媒體的報導就有提到,這個數據庫裡面,有紀錄到Atlassian(阿特拉si-an)這家科技公司的共同創辦人,坎農-布魯克斯的檔案。但這可能沒什麼,因為這家公司開發了很多知名的商用軟體,而創辦人本身是個億萬富翁,也很活躍於政治和能源領域的議題,那本來在網路上,就會有很多他的資料。

但振華的「關係庫」裡面,卻不只是記錄他的資料而已,更詳細記錄了他的妻子、他的四個子女、還有他的住處的相關資訊。又或者像資料庫裡面,也有紀錄英國首相強森的資料,但在強森的資料裡面,也連結到了他的「大學同學」的資料,並且被標註說是「關係密切者」。這等於說,振華數據的這個關係庫,有點像是一個網子一樣,會把資料庫裡每個人跟每件事之間的關係,都連在一起,那這樣做的用意是什麼呢?

有人就認為,這種做法是為了尋找特定人物的「弱點」。以政治人物來說,也許他自己是個很謹慎小心的人,即使做什麼壞事,也都不會留下證據。但即使政治人物本人很低調,他身邊親近的人,也未必跟他一樣低調謹慎。那透過這樣的關係庫,振華的客戶,就有機會發現、甚至是監控他的好友的一舉一動,進而在關鍵的時刻,透過收集到的各種證據,來打擊這個政治人物。

所以這樣聽起來,振華數據在做的事情,還真的跟「劍橋分析」事件有那麼一點像,甚至又更進化一些。


-

【「劍橋分析」加強版?】

大家可能都有聽過「劍橋分析」事件吧,這件事兩年前鬧得很大,因為涉及到臉書啦、英國脫歐、還有美國總統大選,所以很多媒體都有報導,甚至Netflix上面還出了一部紀錄片。

這件在2018年爆發的事情,講的是「劍橋分析」這家英國的數據公司,他們曾經在2014年的時候,在臉書上面開發了一款心理測驗遊戲,讓27萬人下載使用,但劍橋分析卻透過臉書當時系統的漏洞,違規收集了這些人的朋友的相關資料,就這樣收集到了五千萬筆臉書使用者的個資,包含姓名啦、居住地址、朋友名單、按讚的內容等等。然後劍橋分析公司,就開始分析這些個資,把上面的用戶進行分類,找出他們在意的議題跟立場,以及對哪些類型的PO文會有熱情想分享,然後再把這些數據跟分析內容,賣給客戶。

那最著名的客戶,就是川普的競選團隊了,他們透過劍橋分析建立的選民特徵,精準地區分不同類型的選民,再客製化廣告的內容。比方說針對比較容易緊張的選民,就投放一些比較負面的廣告,讓他們害怕對手當選可能會帶來的後果。而對於比較外向的選民,就投放一些積極、熱情的廣告,鼓舞他們一起站出來幫川普拉票。那透過這樣很準確的廣告攻勢,就可以很有效率地,讓搖擺的選民傾向支持川普,讓堅定的支持者願意出門投票、也讓支持希拉蕊的選民打消投票的念頭。

但這樣的做法,不僅是違背了臉書的使用條款,更侵犯了非常多人的隱私,因為他們在使用臉書的時候,可能並不知道,其他朋友玩了一個心理測驗,自己的資訊就會通通被收集,還被拿去分析了。所以劍橋分析的事件爆發以後,這家公司很快地就關門倒閉了,不過這件事臉書也有責任,因此當年有許多人還發起了 #DeleteFacebook 這樣的運動,想要抵制臉書。於是,有越來越多人開始注意到,原來自己放在網路上的這些個人資訊,竟然有可能被偷偷拿來分析、建立模型、甚至是操弄選舉。

那我們再回到「振華數據」,它一樣是透過社群媒體去收集個資,然後再把這些個資之間的關聯性給建立起來,提供給有需要的人。但跟劍橋分析不一樣的地方是,振華的資料庫裡面,大概有一到兩成的資訊,是來自「線下」的資訊,像是銀行的紀錄、求職的申請紀錄等等,有可能是有人透過實體活動收集的、或者是透過暗網之類的非法途徑收集的。

但這次事件爆發後,也是有些人認為,沒有那麼嚴重啦,是大家過度反應了。


-

【是大家大驚小怪嗎?】

有澳洲的記者就認為,振華數據收集的資料,很多都是網路上的公開資訊,這樣的事情全世界有一堆公司都在做,甚至這些社群平台掌握的資料量更是驚人,大家不用對振華數據大驚小怪。而我們也有看到中國的《環球時報》有報導這件事,裡面有聯絡到振華公司的員工,她表示說,他們做的事情是很正常的商業行為,是被國外的媒體刻意曲解跟放大了。

那在振華這邊作出回應後,中國的外交部發言人汪文斌也有出來說話,他引用振華的說法,表示「振華是一間私營企業,客戶是研究機構和商業團體,不收集數據,只做數據整合,有關數據都是互聯網上公開的數據。」,不過我們是有點好奇,如果一切都是正常的商業行為,那振華應該是要開心大家幫他打廣告才對吧,怎麼會把網站關閉呢,這實在是有點,不懂得行銷啊。

【我們的觀點】

看到這裡,不知道大家會不會覺得有點怕怕的,好像一舉一動都在被監視著一樣。

對,沒錯,只要你有在使用Facebook或是用IG、用YouTube,其實某種程度來說,你都是在暴露著你的個人資訊,暴露你喜歡哪些東西、不喜歡哪些東西,給這些平台知道。那這些平台呢,也會把這些資訊拿去賣給廣告主,讓他們對你投放針對性的廣告,所以每次我搜尋了王蟲啦、或是雷姆啦,之後我逛到哪裡,王蟲跟雷姆都會一直跟著我,也是蠻幸福的。啊不是,總之大家一定也有過類似的經驗吧。

但這樣的追蹤技術,大多還是屬於去識別化的,也就是說瀏覽器只知道這個使用者很愛王蟲,但他未必知道這個人是誰。但振華數據的差別可能在於,它是試圖明確的指出,張志祺喜歡王蟲,然後就把這樣的資訊,賣給需要的人。那如果不是王蟲,而是一些特別的資訊,呃...我也不知道還有哪些,那就真的是蠻侵犯隱私的了。

那從劍橋分析、到振華數據,還有各種大大小小的隱私洩漏事件,我們可以看到,我們在各種數位服務上面留下來的足跡,確實已經成為了各國政府還有商業巨頭們,都很重視的資料,甚至有著很高的價值,但大部分的人卻都是蠻輕易地,就把這些資料給公開、或者分享給這些平台跟公司。

我自己是覺得,大家作為一個一般人,或許還不用太擔心被振華數據收集個資,但我們可以做到的是,盡量把各個社群平台上面公開的資訊給整理一下,隱私權設定好,太過個人的資訊都不要揭露,然後盡量用一些可以擋掉追蹤的瀏覽器。那趁這個機會,花點時間好好地整理一下自己的數位足跡,讓這些惡意的人更難追蹤到自己,或許也是一件蠻不錯的事吧!

-

好的,那今天想問大家的是,你的臉書貼文都設定怎樣的權限呢?
A:我都發公開,沒有什麼不能給別人看的!
B:我都只限好友,開公開感覺很危險,都被看光光。
C:我都只限本人,把它當成線上筆記。
D:我沒在用臉書。
E:其他,留言告訴我們吧。

最後,如果你喜歡今天的影片,歡迎分享出去,讓更多人知道「振華數據」的事件是怎麼一回事!
此外也可以點這邊,看看「面對網路釣魚攻擊可以怎麼做?」以及「面對資訊戰,我們能怎麼做」;
那麼,今天的志祺七七就到這邊告一段落,我們明晚再見囉~掰比!



-
【 本集參考資料 】

→ :Chinese Open Source Data Collection, Big Data, And Private Enterprise Work For State Intelligence and Security: The Case of Shenzhen Zhenhua:https://bit.ly/3kWOR0X
→ :Personal Statement on Shenzhen Zhenhua Data Leak:https://bit.ly/3czrqb1
→ :深圳振華數據資料外洩 全球大人物隱私全都露:https://bit.ly/308Prkb
→ :學者:中共黑手伸向全球 不光是監控中國民眾:https://bit.ly/3n00oy7
→ :沈伯洋-簡單說一下對深圳資料庫外洩事件的一些看法:https://bit.ly/341LmPO
→ :深圳数据库里的台湾名单都有什么?:https://bit.ly/2FVKuEz
→ :振华数据库监控240万人 台湾名单首次曝光:https://bit.ly/3kThqfD
→ :深圳「振華數據」:如何看待中國國企「監控資料庫」外洩的消息:https://bbc.in/3iaq8Ek
→ :中國深圳振華數據握有240萬全球具影響力人士的資料庫,8成從公開網路蒐集而來:https://bit.ly/337uM1A
→ :小心“数字面包屑”:中国打响大数据间谍战:https://bit.ly/36pxNg7
→ :Chinese firm harvests social media posts, data of prominent Americans and military:https://wapo.st/30g7uF3
→ :Chinese firm collects data of US leaders, military:https://fxn.ws/3jaiXgX
→ :China's 'hybrid war': Beijing's mass surveillance of Australia and the world for secrets and scandal:https://ab.co/335DVI2
→ :Zhenhua Data leak: personal details of millions around world gathered by China tech company:https://bit.ly/36aX4dw
→ :How an Australian cybersecurity firm helped decipher Zhenhua Data leak:https://bit.ly/3jcwynR
→ :Zhenhua Data: 35,000 Aussies being spied on by China as part of ‘psychological war’:https://bit.ly/342welj
→ :振華數據-wayback machine:https://bit.ly/3mWiOjp
→ :“中企收集大批政要信息”?看看是谁炒的:https://bit.ly/2HvbuLi
→ :台名單首曝光!深圳振華數據蒐全球政要個資 馬英九宋楚瑜在列:https://bit.ly/367zkHo
→ :中國監控全球政要資料庫「振華數據」解密,台灣有2900位名人被監控:https://bit.ly/2S2m8Lt
→ :澳洲朝野:振華數據替中國建混合戰武器:https://bit.ly/309I4sE
→ :印媒:中企蒐集上萬印度人資料 進行混合戰:https://bit.ly/36dYEM0
→ :共軍數據庫監控台灣政要名單曝光 中國外交部回應了:https://bit.ly/3cB2JLe
→ :「臉書」個人用戶數據被濫用?「劍橋分析」在全球有何影響:https://bbc.in/2FXj5Cd
→ :「劍橋分析」事件是什麼?一文搞懂免費心理測驗背後的故事:https://bit.ly/3jbBnhb
→ :專訪前「劍橋分析」業務總監:只要臉書的生意繼續,民主就有危機:https://bit.ly/335E2TY
→ :發生在你我身邊的「劍橋分析」──解析網路時代的窺伺、操弄、盲從與自覺:https://bit.ly/2G3ZKz6
Share to: Facebook / Line
產值將破3兆、排名世界第2,台灣No.1的半導體產業!|志祺七七