目前,人臉識別主要分為兩種,一是人臉識別,二是行人再識別,前者在技術(shù)上可以簡單理解為將兩張圖片放在一起,區(qū)分是否兩個人,而后者指的是是利用計算機視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。
行人再識別的深度學習方法通常有三個步驟:首先,在訓練集上訓練一個分類網(wǎng)絡。然后在網(wǎng)絡收斂之后,用它全連接層的輸出作為特征表達。最后,對所有的圖像特征,計算其歐氏距離,判斷他們的相似性。
在公安部門追蹤嫌疑犯時,雖然攝像頭遍布城市大街小巷,但往往攝像頭無法真正覆蓋所有區(qū)域,同時許多攝像頭的視野也沒有重疊,導致追蹤目標的軌跡出現(xiàn)較大的困難。很明顯,在識別同一個目標時,由于視角、尺度、光照、服飾多樣性、姿態(tài)多變性、分辨率不同以及部分遮擋問題,會導致不同攝像頭間失去連續(xù)的位置和運動信息,影響目標的快速檢索。
在實戰(zhàn)中,視角的變化會帶來場景中的物體與攝像頭光軸呈現(xiàn)不同的夾角,導致二維圖像中物體表象存在差異;而尺度變化則會導致不同目標在圖像中所占圖像區(qū)域的差異,要求算法對尺度具有一定魯棒性,特征提取就會變得困難。這也被稱為極具挑戰(zhàn)性的問題“跨視閾重現(xiàn)目標識別”,但“行人再識別”技術(shù)的出現(xiàn),讓公安用戶看到擺脫肉眼辨識的希望。
行人再識別的深度學習方法通常有三個步驟:首先,在訓練集上訓練一個分類網(wǎng)絡;然后在網(wǎng)絡收斂之后,用它全連接層的輸出作為特征表達;最后,對所有的圖像特征,計算其歐氏距離,判斷他們的相似性。這個過程就出現(xiàn)了一個問題:卷積神經(jīng)網(wǎng)絡中全連接層的每一個權(quán)重向量,往往都高度相關(guān)。這導致了每個全連接描述中個體之間的相關(guān)性,在基于歐幾里得距離時會影響檢索性能。
任何一個高級的算法都迫切的需要跟實際行業(yè)緊密結(jié)合起來,才能真正實現(xiàn)技術(shù)服務于社會。比較顯著的一點,在AI時代要讓安防廠商用得起新技術(shù),必須利用自主知識產(chǎn)權(quán)的核心算法,才能打造低功耗性能的智能前端產(chǎn)品。
在傳統(tǒng)安防中,攝像機采集的數(shù)據(jù)要經(jīng)過后臺對其進行解碼、抽幀、人臉識別與結(jié)構(gòu)化應用,再進行特征碼的提取、后期比對,整個過程使得計算壓力全部集中在后臺,因此如何實現(xiàn)前端在復雜環(huán)境下的數(shù)據(jù)智能采集和結(jié)構(gòu)化變得至關(guān)重要。同時全國600多個大中城市視頻系統(tǒng)建設已初具規(guī)模,安裝攝像頭2000萬多支,監(jiān)控系統(tǒng)26.8萬個,如何實現(xiàn)傳統(tǒng)產(chǎn)品的智能化改造成為迫切的需求。
目前不少企業(yè)針對以上情況,推出智能結(jié)構(gòu)化前端盒子,通過搭載高性能AI芯片,可實現(xiàn)高速率采集、抓拍和人臉屬性分析。能實現(xiàn)在不更換攝像頭的前提下,更方便、快捷的實現(xiàn)前端智能,更好的實現(xiàn)后端分析向前端的過渡。
相信未來3年內(nèi),智能傳感器、算法模型、語音識別、計算機視覺、智能機器人、智能安防將迎來快速增長。
來源:安防知識網(wǎng)