2019
06
17

臉部辨識被「封殺」?微軟刪除全球最大臉部辨識資料庫 MS-Celeb-1M[轉載自科技橘報]

關鍵字:臉部辨識隱私封殺

微軟公開 MS-Celeb-1M,是全球最大的開放臉部辨識資料庫

MS-Celeb-1M 是全球最大的開放臉部辨識資料庫,內含 10 萬個名人,1000 萬張照片。2016 年 8 月,微軟發布標題為《MS-Celeb-1M: A Dataset and Benchmark for Large-Scale Face Recognition》的論文。文中介紹一個辨識挑戰賽,參賽者需要根據微軟提供的數據集,開發自己的圖像辨識系統;微軟也發表大規模臉部辨識資料集 MS-Celeb-1M,開放讓第三者下載。

微軟表示,MS-Celeb-1M 資料庫是針對學術界,後來卻被許多企業採用,例如 IBM、NVIDIA、阿里巴巴、曠視科技等,甚至有消息指出,軍事單位也使用該資料庫訓練臉部辨識系統。

MS-Celeb-1M 內的照片並未獲得當事人同意

此外,外界也對 MS-Celeb-1M 裡照片的合法性質疑。微軟宣稱,MS-Celeb-1M 的照片都來自於搜尋引擎,是公開的。但有媒體核對裡面的照片發現,裡面並不只是 Lady Gaga、Steve Jobs 等名人,還有一些媒體人的資料,例如《連線》雜誌負責報導網路犯罪、網路安全、隱私等問題的資深記者 Kim Zetter。

英國《金融時報》也聯繫了 MS-Celeb-1M 裡面的當事人,發現有些人根本不知道裡面有自己的照片,代表微軟使用的照片並沒有獲得當事人同意。

微軟刪了資料庫,但照片已被不少單位存檔

隨著隱私的呼聲高漲,臉部辨識也受到檢視與挑戰,微軟意識到這個問題,因此刪除 MS-Celeb-1M 資料庫。微軟受訪時表示,這個資料庫原本是用於學術,由微軟前員工營運;目前該員工已離職,因此就刪除該資料庫。

除了微軟,杜克大學與史丹佛大學也跟進,刪除旗下的 Duke MTMC 和 Brainwash 資料庫。雖然微軟已刪除,但相關照片仍可從其他網站下載,而且 MS-Celeb-1M 裡面的照片也被不少企業或機構保存,就算微軟刪除自己的資料庫,這些照片也仍會被其他單位使用,是一種「永生」的狀態。

因此隱私疑慮還在。雖然微軟開放 MS-Celeb-1M 資料庫,的確協助不少單位發展臉部辨識,然而卻不能確定這些照片是否被用於非法用途。這是我們在網路開放資源時需要思考的議題。

參考資料來源:
1.《科技新報》:〈 微軟刪除全球最大臉部辨識資料庫 MS-Celeb-1M,內含 10 萬個名人、1 千萬張照片 〉
2.《微軟》:〈MS-Celeb-1M: Challenge of Recognizing One Million Celebrities in the Real World
3.《VICE》:〈Microsoft Deleted a Massive Facial Recognition Database, But It’s Not Dead
(本文提供合作夥伴轉載。圖片來源: 微軟

傑立資訊傑立資訊事業有限公司

電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map

© 2019 傑立資訊 All rights reserved.