隱私權聲明
本公司關心使用者隱私權與個人資訊,並遵守本公司的網站隱私政策,使用者若有任何問題,可以參考本公司的「網站隱私政策」,或利用電子郵件或連絡電話詢問本公司.
2019
07
12

為何臉部辨識需要大量在地人臉資料?[轉貼自iThome]

關鍵字:專案開發網路行銷

文/余至浩 | 2019-07-11發表

攝影/洪政偉

臺灣很早就展示自主研發實力,甚至臺灣第一套人臉辨識產品,早在10多年前就已問世,即使當時技術仍未成熟,應用受到侷限,但也開啟自主技術發展之路。甚至早在2013年時,臺灣最大桃園國際機場率先啟用的機場人臉通關查驗機制,背後使用的正是國產技術。

2014年的深度學習的出現,更加快臺灣臉部辨識技術發展腳步,不只讓人臉辨識落地成為實際應用,也開始有跨領域的公司,用於機器人、門禁考勤等人臉應用,而且厲害的還不少,比較代表性的廠商如訊連科技、中華電信、研勤科技等,都在最近1年內推出自家的臉部辨識產品,甚至現在全球已有80萬NAS用戶,都在使用臺灣群暉開發的人臉辨識偵測功能,來管理自己的相簿。

不只傳統廠商,更有實力堅強的AI新創加入,如SkyREC,靠著自創人臉辨識演算法,一次可偵測、辨識8千張人臉。就連原本只是使用者的金融業,現在也要轉變成為技術提供者,像是臺灣大型銀行中國信託去年公開展示自行發展的ATM刷臉提款應用,不只認臉,還能偵測異常提款行為,今年下半年也將在新成立的數位分行ATM啟用。

臉部辨識應用全球火紅,也有越來越多應用在臺灣落地,但也開始出現一些水土不服的情況。

10年前就投入刷臉研究的中華電信研究院,原本已經有了一套辨識度達99%的人臉辨識引擎,但是用的是100萬張國外臉孔的資料,來進行模型訓練,要在臺灣用時,辨識效果並不高,後來,決定自行建置臺灣自己的人臉資料庫,僅增加了數千張的亞洲人臉,在實際測試時,人臉辨識率就有將近1成的提升,甚至比起原先用100萬張人臉模型訓練的表現更好,大幅修正了臺灣人臉辨識的效果。

不只中華電信,就連今年3月在全球頂尖NIST人臉辨識大賽成績名列前茅的訊連科技,也都深知在地人臉的重要性。即使技術上已經達到國際一流水準,但是為了改善原本亞洲國家人臉辨識度較低的情況,還在原本的千萬人臉資料之外,另外增加包含臺灣在內多達百萬張的亞洲人臉,重新優化辨識模型,來開發出一個亞洲人專用版本,透過這個新版本,不只原先辨識率提升了0.9%,甚至更達到99.8%的超高辨識率,而且僅容許百萬分之一的誤判率。

資料量反而次要,應用場域的人臉資料才是關鍵

關鍵就在於應用場域不同,臉部辨識模型的辨識效果,就會有很大的不同。甚至可以說,資料量已經不是人臉辨識效果好不好的最主要因素,而是要用應用場域的人臉資料才是關鍵。因為只有從大量的現場拍攝的人臉資料,學習認得這個特定領域下的人臉特徵,才有辨法符合特定應用所需的人臉辨識準確度與穩定度的要求。

尤其,在非約束的複雜環境下,想要讓訓練的識別模型能應付動態多人的人臉辨識,所要面對的技術挑戰也更高。更需要有實際場域的人臉資料,因為,一般訓練用的人臉樣本,大多是在光線充足、不逆光環境下拍攝,而且多是正面照,相較之下,在實際的場域應用中,拍攝到的人臉照片常常會有視角差、光線不佳,也會受到周遭背景、拍攝的姿態角度、表情,以及人臉遮擋的影響(如頭髮、眼鏡、頭部飾品等)等多面向因素,都會影響到應用當下的人臉辨識正確率,也直接反應出這個人臉辨識產品技術力與穩定性。

人臉辨識不只要自己做,更得用臺灣自己的人臉資料

儘管,人臉辨識技術發展,在深度學習加入之後,有了許多重大突破性技術,讓它的辨識率可以大幅提高,甚至比人眼辨識還銳利,但在辨識一張人臉時,通常還是會經過人臉偵測、人臉校正、人臉特徵值擷取共3個步驟。

對於每張人臉進行辨識前,需要先找到人臉的位置,然後通過臉部校正,再取出人臉特徵來進行辨識。其中,特徵抽取步驟最為關鍵,要產生最具有鑑別力的人臉特徵,就必須要將大量人臉照片餵給多層的類神經網路,學習人臉主要特徵,讓它的辨識率盡量越高越好,而誤判率則是越低越好。

在訓練資料方面,現在免費好用的開源人臉資料庫也不少,如MegaFace資料集包含百萬張人臉圖片,因為取得容易,而且資料量夠龐大,常常被用來改進模型,讓研究人員可以設計出更多層的神經網路架構,可以應用在需要更複雜判斷的場域的人臉辨識上。

只不過,現在,這些公開的人臉資料庫,很多都是以國外臉孔居多。尤其,許多資料庫上的人臉資料,以歐美等白人國家的面孔占多數,也很直接反應在臉部辨識率,與誤判率上的差異,只對西方國家人臉辨識特別好,對於亞洲、印度和非洲國家人臉辨識效果就沒有那麼好,也容易發生誤判的情況。

以臺灣臉孔來說,因為和西方國家人臉相比,臺灣人臉輪廓較為扁平,在辨識臺灣自己的人臉時,只要拍攝的臉部角度稍有偏差,就容易會被誤認成別人或發生無法辨識的情況,如果換作是外國人就比較沒這個問題。更有研究發現,不論是使用微軟、或亞馬遜AWS的人臉辨識雲端服務,在測試亞洲臉孔時,辨識率也不如歐美人臉,甚至差距最大有6到8%之多。

就連在偵測如性別、年齡等不同人臉屬性時也容易受影響。例如,麻省理工學院媒體實驗室(MIT Media Lab)去年就曾測試不同家人臉辨識產品,發現除了白人比辨識黑人準確,辨識男性也比辨識女性較準確。這些產品不乏有知名人臉辨識大廠,如微軟、IBM與中國曠視等。甚至,因為人臉資料分布的偏差(bias), 就連雲端龍頭亞馬遜AWS自己也都鬧出誤認美議員為嫌犯的烏龍事件。

又以辨識人臉年齡為例,即使是同樣20多歲的年輕人,歐美人臉看起來就是比亞州人臉更老,所以,用這些歐美資料訓練出來的人臉模型,在辨識亞洲人的年紀時就會不太準,或是測出來的年紀會和外國人差異很大。

人臉辨識更是下一代個人化的身分認證機制

從技術應用需求來看,人臉辨識更是未來所有企業需要,甚至所有IT都會用到的一門AI基礎技術。因為它就是下一代個人化的身分認證機制。以前,要登入桌上型電腦,得先輸入一連串密碼,現在更進一步用人臉確認身分,無需輸入密碼,使用者的臉就是通行密碼。甚至未來更大應用會是零售業,可以經由掃描人臉,來提供個人化的廣告服務,讓門市或店家可以依據消費者的年齡、性別、表情特徵,來提供量身定製的行銷廣告,或商品推薦。

但是想要讓這個人臉辨識引擎,可以認得一張人臉更多細節,就必須要支援在地的人臉辨識技術,如此一來,訓練出來的深度學習模型,辨識出來年齡的效果才會好。

如果用的都不是臺灣在地的人臉辨識技術,只能使用歐美或中國的解決方案,臺灣沒有自己一套在地化人臉辨識引擎,就很難普及。

由於現在全球還沒有一套人臉辨識引擎,可以適用所有人種、膚色,甚至不分應用場域都能用,這意謂著,即使用這個場域資料訓練完的人臉辨識引擎,也不見得在其他場域也能用得好,所以,臺灣也需要自己的一套人臉辨識引擎。

對於企業來說,也只有自己做,才能設計出真正合乎自己應用需求的人臉辨識應用,來滿足不同應用領域差異化的要求。

甚至針對每一個特定領域,未來都需要有這個場域吻合的訓練資料集,才能夠打造出貼近實際場域辨識需要的人臉應用。

臺灣人臉辨識技術進展

 2004年   蒙恬科技推出國產第一套人臉辨識門禁系統      

 2013年   臺灣桃園機場外國旅客通關查驗導入浩鑫人臉辨識核心引擎

 2018年1月   群暉科技替網路NAS管理軟體加入相簿人像自動標註、分類功能

 2018年9月   訊連科技發表結合深度學習技術的FaceMe臉部辨識引擎,準確率可達98.50% (百萬分之一的誤判率)

 2018年12月  中國信託展示國產人臉辨識ATM提款應用,異常提款也能認

 2019年4月   研勤科技推出考勤人臉辨識引擎,準確率達99.32%

 2019年5月   中華電信人臉辨識門禁系統正式推出上市,準確率達99.78%

 2019年5月   本土AI新創 SkyREC公開展示一次可偵測、辨識8千人臉的人臉辨識引擎

你可能有興趣的作品案例
傑立資訊傑立資訊事業有限公司
Powered by AWS Cloud Computing

電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map

© 2019 傑立資訊 All rights reserved.| 網站隱私政策

線上詢價