李子青,人臉識別和智能視頻監(jiān)控專家,主持了多個國家科學(xué)研究項目和重大應(yīng)用工程項目,在相關(guān)領(lǐng)域獲準和申請專利10余項。2004年,李子青作為“百人計劃”入選者來到中科院自動化所,十一年后,創(chuàng)辦AI公司中科奧森,親自主持了多個重大項目的落地。
中科院生物識別與安全技術(shù)研究中心主任李子青
動態(tài)人臉監(jiān)控存在的問題
過去雖然安防行業(yè)更聚焦在智能視頻分析的應(yīng)用上,但是AI跟安防的結(jié)合是持續(xù)不斷的,早在十多年以前就已經(jīng)引入了AI,視頻結(jié)構(gòu)化、人臉結(jié)構(gòu)化、車輛結(jié)構(gòu)化等,都是安防行業(yè)在視頻大數(shù)據(jù)領(lǐng)域最關(guān)注的問題。但現(xiàn)在與過去不同的是,深度學(xué)習(xí)帶來的AI第三次浪潮將AI的概念進一步強化,更深刻地影響著安防行業(yè)。在智能安防產(chǎn)品中,隨著靜態(tài)人臉識別已經(jīng)到了尾聲階段,動態(tài)人臉監(jiān)控當(dāng)前正如火如荼地進行中,但在實際應(yīng)用中卻遇到一些問題:
(1)誤報率太高。以業(yè)務(wù)規(guī)模來解釋,在某個轄區(qū)中有1000路視頻抓拍人像,并且只有一個黑名單庫,假設(shè)每個攝像頭每10秒或者5秒抓拍一張人臉,該轄區(qū)每秒鐘抓拍100張左右的圖象,該轄區(qū)每天要產(chǎn)生864萬張抓拍人臉,跟20萬人的在圖庫比對次數(shù)是1.728萬億次。
對動態(tài)人臉識別的性能要求,用戶希望通過率比較高,例如90%的通過率,在動態(tài)人臉監(jiān)控上面算是較高的水平,意味著它每天的誤報個數(shù)要少于200個?,F(xiàn)在的問題是誤報率太高,如果每次都是“狼來了”,那么就算公安用戶對新技術(shù)的有強烈的需求,也會選擇禁用甚至放棄。
(2)沒有足夠的標注數(shù)據(jù)去解決問題。去年12月份李開復(fù)談AI和大數(shù)據(jù),他的觀點是:具有一定規(guī)模和質(zhì)量的數(shù)據(jù)集成為人工智能行業(yè)發(fā)展的一大制約。搜狗的CTO楊洪濤說,還沒有足夠的數(shù)據(jù)去解決問題。后者的總結(jié)是不太準確的,應(yīng)該是沒有足夠的標注數(shù)據(jù)去解決問題,因為當(dāng)前生產(chǎn)環(huán)節(jié)的數(shù)據(jù)是海量的,就像剛才描述的公安生產(chǎn)環(huán)節(jié)的數(shù)據(jù)并不少。
李開復(fù)說,人工標注這些東西是不解決問題的,必須在真實運用場景里得到閉環(huán)回饋的標注,才能真正地解決AI與大數(shù)據(jù)的問題?,F(xiàn)在行業(yè)做深度引擎開發(fā)的都遇到了這樣的問題。
這就引出了當(dāng)前技術(shù)和應(yīng)用的痛點所在,深度學(xué)習(xí)是需要大數(shù)據(jù)訓(xùn)練的,但是人工標注費時費力,在這方面標注的資源非常有限。行業(yè)里聽說,商湯每個月都要花費幾百萬來做標注,因此深度學(xué)習(xí)還有一定的發(fā)展空間,但是不管是提升算法、改進網(wǎng)絡(luò)架構(gòu),還是通過增大數(shù)據(jù)標注的方式,提升的空間都不會太大,因為它已經(jīng)接近天花板。所以行業(yè)必須在這方面突破——必須像李開復(fù)說的那樣,要形成應(yīng)用場景的數(shù)據(jù)閉環(huán),能夠利用生產(chǎn)環(huán)節(jié)的大數(shù)據(jù)進行自主標注、自主學(xué)習(xí)。
未來AI+安防的趨勢
從應(yīng)用來講,動態(tài)識別的誤報率太高,大數(shù)據(jù)的資源應(yīng)用沒有充分的利用起來,研發(fā)單位不管是公司還是其他,只能選擇在公安現(xiàn)場去訓(xùn)練,或者通過一些手段把數(shù)據(jù)拷下來,自己標注、加工,來提升核心引擎。
從數(shù)據(jù)源頭來講,在傳感器方面,仍然是受到了暗光、強光和逆光的影響,雖然行業(yè)現(xiàn)在有寬動態(tài)、星光型的攝像機,但是這仍然是一個問題。未來的發(fā)展趨勢就是3D傳感器,從Kinect到iphone X到Lidar,這是另外一個趨勢,對二維的識別進行補充。
最后李子青結(jié)合中科奧森的新技術(shù),談了AI+安防未來的技術(shù)趨勢:
第一,大數(shù)據(jù)閉環(huán)自主學(xué)習(xí),行業(yè)通過前端獲取數(shù)據(jù),數(shù)據(jù)抓取之后經(jīng)過結(jié)構(gòu)化或者直接送到后臺大數(shù)據(jù)存儲,通過核心引擎實現(xiàn)數(shù)據(jù)的訓(xùn)練,最后實現(xiàn)后臺大數(shù)據(jù)與核心引擎的再學(xué)習(xí)打通,實現(xiàn)閉環(huán)。
第二,從大數(shù)據(jù)到一人一檔。通過路人庫和名單庫這兩個集合的合輯梳理成一人一檔,實現(xiàn)跨時空的目標軌跡挖掘等應(yīng)用,是核心算法和大數(shù)據(jù)產(chǎn)生的結(jié)果。
第三,新一代智能攝像機,不僅能實現(xiàn)臉、人體、車輛的視頻結(jié)構(gòu)化集成到前端去,而且能實現(xiàn)全光照拍攝功能。
李子青最后總結(jié),安防跟深度學(xué)習(xí)是深度融合的,新銳企業(yè)依靠純算法肯定是沒有出路的,像商湯、曠視這些企業(yè)都在做落地應(yīng)用。安防企業(yè)如??荡笕A等,它們具備市場優(yōu)勢,落地應(yīng)用非常好,AI企業(yè)的核心技術(shù)要比傳統(tǒng)企業(yè)更加前沿,兩者各有各的優(yōu)勢,現(xiàn)階段而言,兩者之間的互動能讓產(chǎn)業(yè)與中國的安防技術(shù)提升到更高的臺階。
原文標題:中科院李子青:AI+安防的技術(shù)和應(yīng)用痛點
文章出處:【微信號:asmag001,微信公眾號:安全自動化】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。