薤白
2017年5月7日 星期日
3D感測行動發展 人臉辨識領先鋒
Google的感測計畫Tango多運用在AR效果上,如娛樂與輔助室內裝潢設計等。
圖為聯想Phab 2 Pro以AR方式展示家具擺設。圖/美聯社
2017年05月07日 04:10 工商時報 拓墣產業研究院研究員蔡卓卲
Xbox的Kinect,在初代即是使用「light coding」這項3D感測技術。
蘋果在2013年11月用3.45億美元價格併購PrimeSense之後,各界對於3D感測技術在行動裝置上的應用便有許多想像,若iPhone正式引入3D感測,預期將吸引更多品牌跟進。而隨著新一代iPhone發表時間愈來愈近,3D感測、人臉辨識等相關技術,也跟著成為討論不斷的主題。
3D感測技術與需求
■3D感測技術原理
目前較常見3D感測技術包括stereo vision、structured light、light coding與TOF(time of flight)四種。
Stereo vision是透過2個相機模組拍攝影像,進行三角測量法等運算取得物體距離,是四者中唯一只需RGB相機模組而不用IR(紅外線)模組的技術。由於stereo vision需進行影像運算,通常需要一個額外影像運算晶片輔助,所以有些晶片廠商會推動這項技術。
Structured light的原理是對目標打出光條紋,再透過打出去的光紋形狀變化來計算形狀和距離,目前較常見於工業檢測和研究用途。隨著IR發展,structured light技術也能透過IR來發射光紋,所以基本零組件會包括IR發射器、IR相機模組與RGB相機模組。
Light coding曾被微軟應用在第一代Kinect,其原理是IR雷射發射後會經過光柵,將光平均分布在測量空間中,然後再透過IR相機記錄每個空間的雷射散斑,設備上需要IR發射器、IR相機模組與RGB相機模組。
TOF是微軟併購的3DV Systems所採用的技術,也是第二代Kinect採用的技術。TOF原理是透過IR雷射發射,獲得空間中每一點達到觀測點的時間,進而推算出距離,再得出3D景深圖,因此需IR發射器和接收器,並配合RGB相機模組和感光元件或感應陣列。
單純4種技術進行比較,stereo vision和structured light都需圖像分析運算,但stereo vision的軟體運算較為繁雜,不適合大量多點感測,且光源和鏡頭間的基線長度也得拉長,整體而言並不適合用於3D感測。
相對地,TOF記錄每個觀測點的時間數據後再進行計算,light coding也只需轉換各區域散斑來計算距離,複雜度較低。不過,這兩項技術均需IR發射和接收器,也會另外需要記憶體甚至是運算元件,成本較高。兩者的運算原理不同,TOF單點IR只需記錄時間,理論上會比light coding先分析散斑圖形再來運算來得簡易,而light coding是將整個畫面切割測距,要得到概略景深圖較容易。
整體而言,TOF的反應速度和精準度最佳,而light coding在不需要精細景深圖時的表現較平均,stereo vision的成本則較低。
■硬體需求
Stereo vision只需要雙鏡頭設計即可執行,以高階智慧型手機多往雙鏡頭發展,只需額外圖形運算元件確保計算速度即可,其他三者則都需要額外的IR發射器、IR接收器與RGB鏡頭模組,最好還有額外記憶體和輔助處理元件。
RGB鏡頭模組是行動裝置原本就具備的零組件,只是為了3D感測需要調整規格,IR接收器則須採用IR CMOS相機模組才能獲得較好感測影像。
IR發射器的變化多,TOF和structured light等技術常採用作為光源,之後再透過光柵和鏡片組等元件進行分光,通過分光元件後,接著就是繞射光學元件(DOE),來改變光的特性,最後再對外投射。
各家廠商在光學技術與設計上的不同差異,也會影響零組件規格、成本與效果,加上演算法差異,即使是同類型的3D感測,也會出現不同效果。
人臉辨識與廠商發展策略
3D感測技術曾透過PS3和Xbox 360的體感功能出現在消費者面前;2016年Pokemon GO遊戲的AR功能喧騰一時,不過AR應用並不必然需要3D感測,3D感測主要的應用將是人臉辨識。
在行動裝置上應用3D感測於生物辨識,可大幅提升安全等級與可靠度,不過,行動裝置並非加上3D感測就能做到真正3D人臉辨識,人臉辨識的原理是透過臉上特徵點當作目標進行比對,比對點越多、信賴區間越小,結果就越精確,由於運算需求較2D辨識龐大,目前的行動裝置效能仍然有限,加上辨識需要時間,速度和便捷度不見得會優於密碼或指紋辨識。
模型精細度也是一大問題,前述幾項技術都能獲得3D景深圖,但作為人臉辨識模型則細緻度不足,若要加入人臉辨識功能,勢必要提高3D感測精細度才行,而這將使成本大幅提高、效益卻不足以彌補。
不過,行動裝置廠商可透過2D影像進行人臉辨識,外加3D感測來確認是否為真人,就不需能完整描繪出人臉3D模型感測功能,又能兼顧快速反應,也只需要前鏡頭的小範圍感測即可,light coding應用在此情境下效益會較高。
行動裝置是否搭載3D感測,需評估成本、空間、應用、效益與獨特性等,其中又以成本為首要門檻。裝置是否能塞得下這些零組件是一大問題,因光學元件尺寸過小會影響品質,而且增加零件就會擠壓行動裝置內部可用空間。
■iPhone與3D感測
2017年的新款iPhone很有可能於前鏡頭搭載3D感測功能,採用light coding技術協助人臉辨識,附加價值在於提高行動裝置安全性,並能達到快速解鎖,但用後鏡頭處放入3D感測元件進行環境感測的可能性比較低。
由於iPhone本身已有用於測量距離的TOF模組,因此搭載3D感測功能所增加的成本不會太高,只需進行調整與整合,例如採用IR CMOS抓取整體3D景深圖、分光元件與DOE依照技術調整光學設計等。蘋果的產品較無價格競爭問題,3D感測與更新其他零組件的成本可能會使蘋果重新訂價,並將成本轉嫁給消費者。
在light coding技術方面,蘋果幾乎已能完全消化這項技術並導入,加上蘋果也買下臉部辨識廠商RealFace,可看出其在3D感測技術應用於人臉辨識的布局,其他業者很難在短期內推出內建light coding的3D感測器,這也給予蘋果在技術、專利與獨特性方面的優勢。
■Google Tango
除了蘋果和微軟,Google也同樣具備3D感測技術:Tango。聯想在2016年就已推出搭載Tango的行動裝置Phab 2 Pro,華碩也在2017年宣布ZenFone AR將支援Tango。
Tango是Google在2014年發表的感測計畫,目的是在行動裝置追加體感功能,並與Movidius(2016年被英特爾併購)進行合作,由Movidius提供感測器和晶片。第一代Tango感測技術類似Kinect,以PrimeSense的light coding模式為主,但到2015年Google I/O發表的第二代Tango,則改為TOF,以求廣範圍3D感測和體感追蹤。
Tango用於行動裝置上是為了環境3D感測來強化AR效果,但其應用價值還是得看app。現在Google上Tango的app數量不多,多數以娛樂為主、室內裝潢設計次之,消費者缺乏購買動機造成廠商仍對Tango提不起興趣。
因此,目前Tango手機宣傳意義大於實際效益,並沒有足以吸引消費者和廠商的應用,Tango模組也並非不能作為人臉辨識的感測器,只因原本設計目的不同,所以直接使用效益不佳,最好還是以前鏡頭用的人臉辨識重新進行設計。此外,即使Tango支援人臉辨識功能,Google也得在Android中提供相對應用功能服務,否則僅靠第三方app,效益就只會是事半功倍。
小結
■iPhone將搶先應用人臉辨識功能
蘋果在2017年推出的新款iPhone有可能在前鏡頭部位搭載light coding技術的3D感測元件,透過3D感測加上面部特徵辨識達到快速人臉辨識效果,應用在安全認證和行動裝置快速解鎖,考量到成本與對運算量、記憶體的需求,該功能只會出現在高階新款產品中,新功能預估也將使新款iPhone的售價提高。
一旦iPhone具備人臉辨識功能,將使其他手機品牌蠢蠢欲動,但Android陣營廠商除非要自行投入資源發展,否則只能選擇Google Tango,然而,目前Tango設計比較偏向3D環境感測而非人臉辨識,最好是等待Google進行Tango調整,並在Android上釋出相關應用功能後再行採用較佳。因此,預期Android廠商推出3D感測人臉辨識功能的時間點會比iPhone要晚,估計要到2018年才有可能看到較多機款。
至於微軟雖然具有Windows Hello功能,但由於Windows手機稀少,主要應用還是集中在自家Surface平板產品,其他品牌廠也不會為了Windows Hello而推出Windows手機,讓微軟雖然在這塊跑得比較早,但在接下來行動裝置的3D感測競爭中,卻顯得較無足輕重。
■3D感測零組件以光學元件為主
除去採用雙鏡頭和較適合用於體感追蹤的stereo vision外,TOF、structured light與light coding都需要IR發射器和IR接收器,再搭配既有前鏡頭或後鏡頭來作3D感測。IR發射器和IR接收器是3D感測中較為重要的零組件,也是行動裝置較少使用的零組件。
IR接收器基本上會採用IR CMOS相機模組,而IR發射器模組則透過VCSEL發射雷射光源,透過分光元件和DOE後在投射出去。依照採用技術和演算法的不同,IR光路設計和波前也會不同,所需零組件設計也會有所差異,這將導致同類型技術的不同設計會產生不同效果,對裝置硬體的運算負荷需求也將不同。
如果希望能有更好反應速度或分擔裝置本身的硬體負荷,可在感應器端追加獨立運算元件和記憶體,先處理基本3D感測運算,然後在到裝置本體的運算元件進行應用服務運用。
(本文作者為拓墣產業研究院研究員)
(工商時報)
2016AR
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言