【中國傳動網 人物專訪】 作為人工智能的一個分支,計算機視覺(機器視覺)是一門研究教機器學會“看”的學科,其目的在于使計算機具備和人類匹配的視覺感知和理解能力。近年來伴隨著電子信息技術的高速發(fā)展,互聯(lián)網特別移動互聯(lián)網的普及,以及各類攝像頭的廣泛應用,全球圖像視頻數據爆炸式增長,人類社會正在進入視覺信息的大數據時代。海量的圖像和視頻在方便人們生產與生活的同時,也對智能視覺技術提出了新的挑戰(zhàn),對視覺技術的適用范圍、魯棒性和效率等提出了更高的要求。目前大多數視覺處理系統(tǒng)可以較好地采集、傳輸和存儲圖像視頻,但是對視覺內容高效的分析和準確識別理解能力往往還有待提升。計算機視覺的應用正在從傳統(tǒng)的受控條件下工業(yè)視覺、OCR等拓寬到無人駕駛、動態(tài)人像識別、視頻監(jiān)控等更為復雜的場景。近年來深度學習方法的快速發(fā)展,為解決上述問題提供了有效的途徑。深度學習方法(Deeplearning)作為傳統(tǒng)神經網絡的拓展,利用包含多個隱層的深層神經網絡,解決需要高度抽象特征的人工智能任務。深度學習借鑒了人腦的多層神經細胞處理結構,多層非線性結構使得深度神經網絡具備從視覺大數據中學習抽象語義特征的抽取能力和對復雜任務的建模能力。深度神經網絡在LFW人臉識別、ImageNet物體分類等任務甚至超過了人的表現(xiàn)。
2017年國務院關于印發(fā)《新一代人工智能發(fā)展規(guī)劃》也把視覺技術作為重點發(fā)展的基礎理論和關鍵技術領域進行布局。中國人工智能學會副理事長譚鐵牛院士提出:”圖像視頻大數據是人工智能的突破口,是信息產業(yè)新的增長點”。智能視覺技術已經成當前學術研究和創(chuàng)新創(chuàng)業(yè)的熱點領域。谷歌、微軟、百度、騰訊、阿里等互聯(lián)網巨頭密集布局視覺領域的研發(fā),商湯、依圖、曠視等視覺初創(chuàng)企業(yè)完成高額融資快速成長。毋庸置疑,智能視覺技術將賦能產業(yè)的方方面面,給未來的生產生活帶來深刻變革。
中國科學院深圳先進技術研究院集成所多媒體集成技術研究中心主任喬宇