在面向大數(shù)據(jù)的架構(gòu)中,可根據(jù)實際現(xiàn)場的部署需要,設立一個或多個集群組成,采集的流數(shù)據(jù)會被劃分成段,并分布于數(shù)據(jù)集群節(jié)點,因為集群節(jié)點有內(nèi)部進行多副本備份等機制,可以由軟件技術(shù)來保證整體系統(tǒng)的高可靠性和高穩(wěn)定性。這些數(shù)據(jù)節(jié)點可以采用廉價通用型的硬件,避免采用傳統(tǒng)高端硬件的模式,能極大地降低投資成本。
錄像文件的集群存儲,國內(nèi)云儲存廠家多采用CEPH技術(shù)和HDFS技術(shù)的方式。以HDFS的方式舉例,思路為:通過HADOOP提供的API結(jié)構(gòu),實現(xiàn)將接收到的視頻流文件從本地上傳到HDFS中。在這一過程中,把接收到的視頻文件不斷地存儲到一個指定的本地臨時文件夾中,而這個本地文件夾是在不斷動態(tài)變換的,可以將該文件夾當成是一個“緩沖區(qū)”,把“緩沖區(qū)”中的文件以流的方式將上傳到HDFS中。
原始的視頻圖像是一種非結(jié)構(gòu)化數(shù)據(jù),它不能直接被計算機和上層應用軟件讀取和識別,為了讓視頻圖像更好的應用,就必須對視頻圖像進行結(jié)構(gòu)化的處理,提取出關(guān)鍵信息,并進行文本的語義描述,也就是視頻結(jié)構(gòu)化。
一段視頻里面,需要提取的關(guān)鍵信息主要有兩類:第一類是運動目標的識別,也就是畫面中運動對象的識別,是人還是機動車或者非機動車;第二類是運動目標特征的識別,也就是畫面中運動的人、車、物有什么特征,行人特征主要有:是否帶眼鏡、圍巾、上衣、褲子、是否帶口罩、是否背包,性別分類等;機動車主要特征有:車牌號碼、車身顏色、車型等;物體特征主要有:大小尺寸、顏色、方向等。
一個案件的審看需要更為廣泛地查看相關(guān)的攝像機視頻,所審看的視頻量時常達到數(shù)百上千小時。視頻結(jié)構(gòu)化提取技術(shù)對視頻中運動的物體等進行提取,再通過軟件進行檢索和排除,這就能極大地提高辦案效率。