近兩個月,國內團隊先后在全球權威的人臉檢測評測平臺FDDB和全球自動駕駛算法公開排行榜KITTI以及Cityscapes上取得非常好的成績,這在一定程度上證明了國內計算機視覺相關算法已達到國際頂尖水平。
今年ILSVRC 2016(全稱是ImageNet Large Scale Visual Recognition Challenge)分為五大部分,包括:目標檢測、目標定位、視頻中目標物體檢測、場景分類、場景分析。在昨天,全球最為權威的計算機視覺大賽ILSVRC2016(大規模圖像識別競賽)公布了算法排名結果,Hikvision(海康威視)奪得場景分類第一名。
那么,今年的ImageNet的比賽為什么由這5部分組成?Hikvision(海康威視)是如何在場景識別一項中奪得冠軍的?今天本站請到了海康威視首席科學家、海康威視研究院常務副院長蒲世亮先生為我們講解ILSVRC2016相關的詳細細節。
浦世亮,法國國家科學研究院(CNRS)博士、浙江大學博士,現任海康威視(杭州海康威視數字技術股份有限公司002415)首席科學家、研究院常務副院長、海康威視博士后科研工作站負責人、博士后導師,帶領海康威視研究院的研發團隊負責海康威視在視頻應用領域的前瞻性、戰略性基礎技術研究。其個人曾獲第十九屆求是杰出青年獎、浙江省有突出貢獻中青年專家、浙江省科學技術進步一等獎、杭州市131中青年人才等多項榮譽;已申請發明專利90多件,獲得授權發明專利11件,并在知名期刊、國際知名會議ICDAR、ICPR等發表多篇論文。
今年ILSVRC比賽為什么是這5部分,跟往年有何變化?
今年ILSVRC分為
任務目標檢測(object detection)
目標分類與定位(object localization)
視頻中的目標檢測和跟蹤(object detection / tracking from video)
場景分類(scene classification)
場景分割(scene parsing)
與去年相比今年增加了一項場景分割任務。這五類任務都是計算機視覺領域基礎的人工智能任務,有廣闊的工業應用前景。與去年相比,今年增加了一項場景分割任務。
簡單介紹一下ILSVRC 2016五大部分的參賽規則?
鑒于這個參賽規則相對復雜,請參考ImageNet官網權威說明。http://image-net.org/challenges/LSVRC/2016,這是訪問地址。
大致來說,五項任務提供了基礎的訓練集和測試集,各參賽隊伍在訓練集上訓練,在測試集上完成測試,提交測試結果,然后,由組委會統一評估性能,并給出排名。