服務(wù)熱線
歡迎訪問西莫羅(北京)智能科技有限公司網(wǎng)站
日期:2017-06-01瀏覽:706次
北京西莫羅閘機(jī)一個(gè)動態(tài)的場景當(dāng)中能夠做到的人臉檢測
1:N的部分也會分為三個(gè)階段,大家zui了解的可能是后面的人臉識別,前面的兩個(gè)階段還是很重要的。
首先,我們要在一個(gè)動態(tài)的視頻流當(dāng)中找到人臉的位置。
然后我門找到人臉位置以后,還要知道這個(gè)人臉可能有側(cè)臉、逆光和模糊的情況出現(xiàn),所以還會有一個(gè)判斷的過程,我這張臉每秒25幀里面哪一幀圖片是適合去做人臉識別的,zui終會抽取一張比較適合去做人臉識別的照片,zui后再去做人臉識別真正的比對,所以是三個(gè)步驟。
這是給大家展現(xiàn)一個(gè)能力,其實(shí)是在一個(gè)動態(tài)的場景當(dāng)中能夠做到的人臉檢測,也就意味著是說做*個(gè)步驟,中間你會看到是有連續(xù)性的,如果斷掉有可能會抓第二次的人臉,抓到兩張照片到底哪張人臉做識別,所以這里面就會涉及到一個(gè)質(zhì)量判斷。后面的話,其實(shí)給大家也會做一個(gè)游戲,這個(gè)底下是個(gè)底庫的照片,上面是現(xiàn)場抓拍的照片,我不知道大家用多長時(shí)間用7個(gè)人能夠真正的連線起來。10秒鐘已經(jīng)過完了,我相信大家基本上10秒還沒有連完,底下的底庫照片是我們在杭州真正的在逃人員,這里面有*逃犯,下面是現(xiàn)場抓拍到的照片,基本上的話,其實(shí)容貌差別還是可以看到的。通過人去判斷,*效率和實(shí)效性還是有一定的影響,第二人的判斷多多少少還是有一些差別會比較大的,也不一定能夠認(rèn)得出來,比如說中間的老太太,差別還是很大的。
所以可以看到用到這種機(jī)器的方式和機(jī)器視覺、人臉識別,更多的方式現(xiàn)在還是要提升人員的效率,降本增效的概念。大家比較關(guān)心的是說這個(gè)東西到底現(xiàn)在能不能用,或者說只是展示了一個(gè)demo還是一個(gè)技術(shù)能力?我們認(rèn)為我們會從幾個(gè)點(diǎn)來分析,到底現(xiàn)在到不到實(shí)用的階段。
首先從技術(shù)上來看,首先我們在識別的領(lǐng)域當(dāng)中,現(xiàn)在大家是可以做到萬分之十的誤識別的概率,所謂的誤識別識別率是有幾個(gè)定義的,包括識別成功率、誤識、漏識是有概念的,這是業(yè)界通用的幾個(gè)標(biāo)準(zhǔn)。
第二活體驗(yàn)證。這部分之前2016年有一則新聞,當(dāng)時(shí)說的是趙薇的老公司機(jī)套用了他的信息包括他的照片,zui后把他的房子還是車給賣了,那個(gè)時(shí)候確實(shí)是做了實(shí)名的比對,但是其中少了一個(gè)環(huán)節(jié)是活體驗(yàn)證,用的是趙薇老公的照片直接做了實(shí)名,所以通過了整個(gè)的審計(jì)環(huán)節(jié)和風(fēng)控環(huán)節(jié),所以在活體驗(yàn)證階段已經(jīng)有比較完善的活體技術(shù),包括像支付寶現(xiàn)在也在用的,為什么他們敢用是有很多的活體技術(shù)促成的,在你們驗(yàn)證過程中,有的時(shí)候你會發(fā)現(xiàn)會讓你做一些配合性的動作,這些動作也是為做一個(gè)活體驗(yàn)證做的資料的準(zhǔn)備。
第三,逆光的場景。在我們真正用的時(shí)候,像今天這個(gè)陽光就很強(qiáng)烈,真正用的時(shí)候到底能不能用的起來,不像一個(gè)實(shí)驗(yàn)室,標(biāo)準(zhǔn)上我識別的成功率是在99%或者是幾個(gè)9的概念,真正的逆光的場景下,有可能*就變成零,*是不可用的狀態(tài)。
所以在很多的 角度講,2016年很多公司會講在這些關(guān)鍵技術(shù)上已經(jīng)有了突破,另外一個(gè)比較好的方式是說,人臉識別的生物識別技術(shù),其實(shí)是相對于用指紋、虹膜和其他的掌紋來的會更加便捷。
*臉是一個(gè)*的標(biāo)識。比如說用指紋識別,有時(shí)候會有油膩,手指也比較臟,掌紋和虹膜的采集又是比較復(fù)雜的過程,所以從技術(shù)角度講,我們認(rèn)為它已經(jīng)具備了商業(yè)化的能力。
第二,我們從時(shí)間軸來看一下。其實(shí)任何一家人臉識別和人工智能的公司都會經(jīng)歷五個(gè)階段,*階段和第二階段主要是在實(shí)驗(yàn)室階段,這個(gè)階段其實(shí)大家也比較了解,基本上會去刷榜,大家會看到我參加了LFW的一些第三方的公共的公開數(shù)據(jù),我已經(jīng)變成了世界*,我超過了 、Facebook,這是刷榜的環(huán)節(jié),大家也知道其實(shí)是有很多的手段的。
第二個(gè)階段會到我能證明我學(xué)術(shù)的方式能夠做到非常*的水平,我想讓所有人都會去用,這個(gè)時(shí)候會產(chǎn)生SDK,給大家去裝。SDK的過程中和實(shí)驗(yàn)室算法階段特點(diǎn)都會比較輕,覆蓋范圍也會比較目前廣,問題就是說,如果我們做人臉識別只給一個(gè)SDK給到所有的合作伙伴的時(shí)候,合作伙伴真正裝了SDK,到底能不能把他的場景業(yè)務(wù)跑的起來這件事情,其實(shí)沒有人知道。比如說你在SDK裝進(jìn)去的時(shí)候,會不會遇到逆光的場景,會不會遇到識別距離的問題、會不會遇到陰暗面的問題,其實(shí)很多的東西是判斷不出來的。
第三個(gè)階段,由我們來輸出一些單一的功能性產(chǎn)品或者是單一的功能性解決方案。所以是跟場景結(jié)合的,比如說跟門禁結(jié)合、考勤結(jié)合,跟線上的實(shí)名結(jié)合,真正的風(fēng)控可能我們不做,但是實(shí)名的業(yè)務(wù)是一個(gè)單一的功能點(diǎn),這是可以做的,解決一個(gè)真正問題的環(huán)節(jié),但是全流程業(yè)務(wù)我們現(xiàn)在覆蓋不了。
第四個(gè)階段,會是一個(gè)解決方案的層級,在人臉識別或者是人工智能視覺的領(lǐng)域中會提供一個(gè)端到端的解決方案,由我們來替客戶去想象我前端的硬件設(shè)備是什么樣,后端的算法處理器是什么樣,算法是跑在云端還是本地的,是智能化前移還是云計(jì)算處理的,這個(gè)時(shí)候更多的合作伙伴應(yīng)該想象的是他的上層業(yè)務(wù),比如說直業(yè)務(wù),所有的快手這些直播平臺,其實(shí)直播應(yīng)該想到的是怎么維護(hù)主播,來運(yùn)營平臺,來創(chuàng)造不同的事件,但是直播里面的兔耳朵這些工具,其實(shí)不應(yīng)該是自己開發(fā)的,而且又耗時(shí)耗力。所以這些是不同層級的解決方案。
第五個(gè)階段,就是一個(gè)綜合平臺,因?yàn)槿魏我豁?xiàng)技術(shù)都不是的,而且也是單一的功能點(diǎn),所以除了人臉識別之外,有可能還會結(jié)合不同的API的接口調(diào)用,有時(shí)候里面會涉及到指紋、門禁開關(guān),所以會是一個(gè)綜合性的平臺。
現(xiàn)在任何一家公司基本上都要經(jīng)歷這五個(gè)階段,北京西莫羅是成立比較早,所以時(shí)間窗上相對來講會有一定優(yōu)勢,其他家現(xiàn)在是在紅色部分的區(qū)域范圍之內(nèi)。