隨著高清視頻時代的到來,視頻監控的點位數和數據量已呈爆發式增長,傳統的智能算法還停留在比較淺層的分析識別上,具體表現為準確率低、環境適應性差、識別種類少。然而,從97年IBM“深藍”以3.5:2.5擊敗國際象棋世界冠軍卡斯巴羅夫到17年1月谷歌“阿法狗”升級版Master在人機圍棋比賽中取得60連勝,我們不得不相信,人工智能的時代以洪荒之勢已然來臨。
人工智能的崛起離不開三要素:深度學習為算法提供了重要基石,大數據為存儲提供了高效燃料,GPU、超級計算機、云計算為運算能力提供了引擎助力。其中,深度學習作為核心的技術支撐,其靈感來源于大腦神經網絡,讓機器具備了人類對事物抽象和重構的能力,在算法層次上由淺至深,在特征設計上從人造特征到自主學習,讓機器擁有接近甚至超越人類的模式識別精度、超強抗干擾的環境適應能力以及強大的種類識別能力。作為機器視覺具代表性的應用,視頻監控系統的發展及應用狀況又是如何呢?
“中國芯”正在迅速崛起
網絡高清時代的到來為我們帶來了更好的圖像質量,使攝像機可以更好的記錄現實場景,這同時也對芯片商提出了更高的要求。目前國內工業化、標準化的加速及第三方的介入給芯片設計業者提供了快速進入市場的可能,從而推動了芯片國產化和產業化的逐步升級。而安防行業的蓬勃發展,讓國產芯片廠商看到了希望,以華為海思為代表的一批致力于國產芯片研發生產的企業,將目光聚焦在安防芯片上,試圖在安防行業一展拳腳,發揮價值。
中國安防芯片的技術演進路線越來越清晰,功能多樣化的趨勢日趨明顯。有了“中國芯”,一方面所有的芯片產品定義真正來自國內客戶、系統集成商以及終行業用戶需求,在源頭上保證芯片真正滿足客戶需求。另一方面,在芯片布局上緊密契合國內客戶的產品演進,推動視頻監控產業的持續升級。
前端設備插上了深度智能的翅膀
作為視頻監控的前端設備,監控攝像機是整個視頻監控系統的重要組成部分,它經歷了從模擬到數字化、網絡化、高清化以及智能化的發展歷程。視頻圖像來源是視頻監控系統的第一環,運用傳統的攝像機存在很大的局限性,如檢測準確率不高,漏抓誤報比較多,抓拍不清晰,圖像質量不理想等。前端攝像機內置深度學習算法,可以對人臉、車輛等關鍵信息進行快速定位抓拍,有效解決漏抓誤報問題,也能為后端分析服務器提供更清晰、更高質量的圖片,更出色的成像效果大大提升了后端的資源利用率,同等條件下可大幅節省中心部署空間,同樣的投入可以產生更大的效用。
以攝像機起家的安防龍頭海康威視在其新推出的“深眸”系列前端攝像機中內嵌深度學習算法,具有結構化信息提取、小型人臉庫比對、人體屬性分析、人員流量統計、道路實況檢測、車輛特征識別、全景監控等多種功能,將前端設備的智能化應用發揮到極致。此外,還將人眼仿生、MSS多光譜成像、被動紅外熱成像技術等技術融入其中,可對因環境造成的圖像模糊昏暗進行亮度與清晰度的還原,還能實現環境測溫、防火防盜等功能,引導著前端設備在深度智能化這條路上越走越遠。
深度學習開啟智能視頻分析技術的新篇章
近年來,深度學習在語音識別、圖像識別、自然語言處理等應用中取得了顯著的成效。深度學習也正影響著安防企業,影響著智能視頻分析技術。智能視頻分析是計算機圖像視覺技術在安防領域應用的一個分支,是一種基于目標行為的智能監控技術,其支持的功能主要有:人車物特征識別采集、人員及物件行為報警、視頻信號及質量診斷、視頻增強處理、圖像比對、視頻摘要、內容分揀等。深度學習解決了傳統智能視頻分析技術人工選擇特征準確率低、淺層學習模型無法解析大數據等問題,使視頻分析過程中識別準確率更高、環境適應性更好、識別種類更豐富。
在以人、車、物為核心視頻特征識別領域,目前成熟的其實是車輛識別算法,在平安城市建設和公安實戰創新的推動下,車輛識別技術在智慧交通、智慧警務等行業的應用取得了不錯的成果。國內以深圳華尊科技為代表,在算法準確率、系統穩定性、識別種類、公安車輛大數據實戰應用上表現得較為突出,且數次在華為國內外的大型活動中亮相。人臉識別算法因其應用的廣泛性,火爆程度遠遠大于車輛算法,但就目前的技術來看,在準確率、更深層的應用上還有很高的提升空間,以曠視、商湯為代表的算法公司也在高校人才及技術儲備、各行業的淺層應用上做出了努力。
大數據時代為算法研究提供了高效的計算工具,而數據量的增加也意味著需要更復雜的視頻分析算法模型來詮釋和挖掘這些數據,使占有巨大存儲資源的視頻數據發揮出更多的價值。目前人員行為分析、人群分析等復雜的算法還在起步階段,讓我們想象一下,基于對人體、生物體行為細節的精確捕捉和復雜分析模型,一個城市級的視頻大數據中心將能為公共安全、各類學科研究、商業發展乃至人類的進步做出多大的貢獻。
海量視頻數據存儲呈現前端分布式存儲、后端集中存儲和云存儲三種模式
隨著視頻圖像清晰度的不斷提高,其存儲需求也在不斷發生變化。在安防視頻監控領域,目前主要存儲方式有三種:前端分布式存儲、后端集中存儲和云存儲。
原有的模擬及模數混合組網的視頻監控正逐步被純IP化、全高清的網絡視頻監控所取代,因此前端分布式存儲產品也由DVR、HDVR(混合式DVR)逐步替換成NVR產品。隨著前端分布式存儲的系統組網成本不斷降低,同時4K、H.265技術的推出大大提高了視頻圖像的清晰度,并通過改變編碼方式降低了存儲空間需求,使得前端NVR存儲產品的競爭力進一步增強。另外,NVR產品由于其簡單易用的特性,為不同層面的客戶所廣泛使用。
相對NVR的分布式存儲而言,后端集中存儲方式更加注重數據的集中保存、數據的可靠性及統一的管理維護,同時具有較好的容量擴展能力,因此后端集中存儲方式更適合大規模部署。集中存儲主要以SAN/NAS為主要代表,其中SAN因為其高性能、高穩定性而被廣泛采用。FC SAN產品延時小、可靠性高,但建設成本也高很多,針對于視頻監控的大容量存儲需求來說并不是非常合適,而IP SAN產品由于其互聯互通性高、管理維護簡單、建設成本相對低廉等優勢而為安防視頻監控行業所廣泛應用。
采用多臺IP SAN存儲設備疊加的方式勉強實現視頻接入和圖像存儲需求時,由于多臺存儲設備間相互獨立,缺乏有效的數據整合與協同處理能力,因此也額外帶來了存儲設備的統一管理、設備冗余性能和存儲空間無法共享及利用等問題。應需而生的云存儲利用集群化、虛擬化、分布式文件系統等技術對整個系統內的設備資源、帶寬資源、存儲空間資源等進行統一整合,從而為用戶提供大容量、高性能、高可靠的透明存儲服務。在云存儲技術中,不同廠家的應用方案也有所不同,安防廠商基于對業務的理解順勢推出安防專用云存儲,數據存儲廠商則力推通用云存儲以期滿足用戶多樣化需求。
視頻監控在各行業的應用情況
據立木信息咨詢發布的《中國視頻監控市場調研與投資前景預測報告(2017版)》顯示:當前,視頻監控的主要需求依然來自于平安城市建設、行業延伸及民用市場開啟。伴隨著我國城鎮化的持續推進,政府對平安城市、智慧城市建設及升級改造的重視,各行業對視頻監控及視頻應用需求的進一步提升,居民對人身安全、財產安全的重視程度不斷提高,促進視頻監控行業市場規模繼續保持快速增長。此外,伴隨著“中國制造”、“互聯網+”的開展,視頻監控也得到政策的大力支持。
從發展勢頭來看,傳統的金融、能源市場趨于飽和,政府、交通市場還在持續快速增長,民用、醫療、教育等新興市場保持高速增長勢頭。
就智慧城市建設而言,目前大城市的安防基礎建設工作已基本完成,中小城市正處于蓬勃發展階段,視頻監控更多的向聯網化、智能化和高清化方向發展,同時隨著對數據和有效信息利用要求的提高,云存儲、大數據和云計算也開始發展。
在智能交通領域,隨著智能手機和無線互聯網開始普及以來,互聯網的體驗型應用越來越滲透到智能交通中,此外,視頻智能分析、車聯網等技術不斷突破,不僅提高了公安交警的工作效率,也給普通民眾提供了更便利、更人性化的平臺。
民用市場迎來發展期。隨著人們生活的水平提高,消費者正在成為推動消費安防的重要力量,中小企業、商鋪、家庭逐漸成為常規安防需求的中堅力量。目前,我國民用安防監控只占了6%的市場份額,遠遠落后于發達國家(如美國民用安防監控產值占據了整體的30%以上),具有非常強的發展潛力。隨著家庭市場的發展成熟,市場會向更高一級的使用便利化以及有序管理服務方向發展,家庭監控將融合移動監控、云存儲、隱私保護以及綜合運營服務,不單單是安全功能,同時也向個人價值的滿足和分享方向發展。
視頻監控行業化應用能力的不足之處
國家SVAC編解碼能力亟待提升
監控數據作為敏感的可視化信息,已經成為國家安全的重要組成部分,敏感視頻外流給國家和地區造成的輿論壓力非常大,所以我國具有自主知識產權的視頻監控專用編解碼協議SVAC得到了公安部的高度重視,也在廣東等地區進行試點推廣。原定于去年推出的SVAC2.0版本協議延至今年發布,6月1號起正式實施,但是與主流的H.264、H.265相比,SVAC技術迭代進展相對較為緩慢,在碼流壓縮傳輸方面還有較大的差距,市場產品線也還不夠完整。
產品缺乏亮點
目前視頻大數據還處于相對比較初期的階段。整個視頻大數據的領域,包括了云存儲、云智能,以及大數據分析和挖掘。云存儲在行業內已經相對比較普遍,但是各個廠家對云存儲的定義不盡相同,有很多拿傳統的存儲系統包裝一下出來就是云存儲。云智能也是面臨著同樣的問題。大數據分析和挖掘部分則還處于相對早期的探索階段,因為它依賴于數據的沉淀、匯聚和清洗。目前市場上絕大部分安防產品的同質化競爭過于激烈,產品缺乏足夠的亮點。早期的監控平臺并不是以云架構方式建設的,也沒有數據開發共享的概念。在大數據時代的整體背景下,原來的很多監控平臺難以支撐大數據的應用,市場急需一個新的云架構的監控平臺來支撐未來的發展。
視頻分析準確度低、缺乏深層次挖掘
視頻監控行業發展這些年,視頻分析準確度低是制約其得以大規模應用的首要問題,系統針對復雜異常行為建模困難,目標與背景接近會導致目標特征信息提取困難,運動目標被遮擋會造成目標信息缺失,目標移動速度過快或算法過于復雜導致跟蹤的有效性較低,這些因素都很容易造成誤報、漏報、跟蹤困難等結果。同時,對于視頻圖像信息也缺乏深層次的挖掘,難以支撐不同用戶的差異化應用需求,視頻圖像信息及數據的價值仍未得到充分地利用。
視頻圖像檢索速度慢、效率低
前端采集設備不斷回傳的視頻、圖片等信息,都需要在平臺服務器上疊加算法進行分析,由于服務器本身處理性能的限制,無法并行處理日益累積的超量數據。視頻監控每天的數據量就有高達上千PB,累計的歷史數據越來越龐大,系統也就逐漸暴露出數據存儲壓力大,檢索速度越來越慢,數據統計、分析效率越來越低等問題。因此,雖然智能分析服務器的應用為公安、交警等需要大量檢索視頻的情況節省了人力與時間,但整體的效率仍有較大提高的空間。
在安防市場需求的催生及深度學習技術的助攻下,智能視頻分析技術目前已成為當下炙手可熱前沿的技術之一。讓我們期待,在平安城市向智慧城市逐步過渡的進程中、在技術儲備與市場孕育趨于成熟之時,智能視頻分析技術將于全面化、深層次的應用中帶領我們迎來一個全新的智慧時代。