- 資訊與博客
商湯及聯合實驗室37篇論文入選ECCV 2018,識別、檢測與場景分析等技術獲關鍵突破
9月8日-14日,備受矚主张2018歐洲計算機視覺大會(ECCV 2018)在德國慕尼黑召開,ECCV兩年舉辦一次,與CVPR、ICCV共稱為計算機視覺領域三大頂級學術會議,每年錄用論文約300篇。根據ECCV 2018宣佈的最終結果,商湯科技及聯合實驗室共有37篇論文入選,超過微軟、谷歌、Facebook等科技巨頭。商湯科技ECCV 2018錄取論文在以下領域實現突破:物體檢測與跟蹤、自動駕駛場景理解與分析、視頻分析、3D視覺、底層視覺算法、視覺與天然語言的綜合理解等。這些新穎的計算機視覺算法不僅有著豐富的應用場景,使得更多的智能視覺算法能應用於日常生涯之中,還為後續钻研提供了可貴的經驗和方向。
如入選論文《量化仿照-訓練面向物體檢測的極幼CNN模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》,本文提出一種簡單而通用的框架—量化仿照,來訓練面向物體檢測任務的極幼CNN模型。作者提出聯合仿照與量化的步骤來減幼物體檢測CNN模型的參數量實現加快。在有限計算量的限度下,該框架在Pascal VOC和WIDER Face數據集的物體檢測机能均超过了當前物體檢測的先進水平。
而在幾個月前舉行的CVPR 2018會議上,商湯科技、香港中文大學-商湯科技聯合實驗室以及其他商湯科技聯合實驗室共有44篇論文中稿,商湯科技今年累計入選計算機視覺頂會論文斏秸痏到81篇。
商湯科技聯合創始人、商湯钻研院院長王曉剛暗示,「商湯始終堅持對原創技術的極致钻营,正是這種一目十行的心灵讓商湯在諸多計算機視覺前沿技術領域上不斷获得新突破,亦在行業應用方面全面落地。本次會議,華人入選ECCV 2018 的論文數量极度搶眼,近年來華人學者們對原創钻研孜孜不倦的堅守,鑄造CV技術領域的一股生力军。」
參加COCO 2018和VOT 2018均奪冠
商湯原創技術的不斷進步亦在沉要的比賽中得到驗證。在2018年的COCO比賽中,商湯科技钻研員和香港中文大學-商湯聯合實驗室同學組成的團隊,在主题的物體檢測(Detection)項目中奪得冠軍。
在这次競賽中,商湯團隊創造性地開發了三項全新的技術,獲得了大幅度的机能提升:
(1)新的多任務混合級聯架構(hybrid cascade)。通過將分歧子任務進行逐級混合,這種新架構有效地改善了整個檢測過程中的信息流動。
(2)通過特徵導引產生稀少錨點,而不是使用傳統的規則分佈的密集錨點。這種特徵導引的规划使得錨點的投放更為精准,均匀召回率提升了超過10個百分點。
(3)採用一種新型的FishNet網絡結構,它有效地保留和建改多個尺度的信息,能更有效地用於圖像級,區域級,以及像素級預測任務。
在test-dev上,商湯團隊對上述框架進行了全面測試,其中單模型和多模型(最終提交的結果來自於五個模型混合的框架)的mask AP分別達到了47.4% 和49.0%,比去年冠軍(亦是商湯團隊獲得)的結果,44.0% 和46.3%,有約3個百分點的明顯提高。 在傳統的基於檢測框的指標bbox AP上,這個新的框架亦分別達到了單模型54.1%和多模型的56.0%的机能,比去年冠軍的結果,50.5%和52.6%,亦有較大的提升。
值得一提的是,為了推動視覺檢測技術的進一步發展,在ECCV期間,香港中文大學-商湯聯合實驗室還開源了檢測庫mm-detection(https://github.com/open-mmlab/mmdetection)。這個開源庫提供了已公開發表的多種視覺檢測主题模塊。通過這些模塊的組合,能够迅速搭建出各種驰名的檢測框架,好比Faster RCNN,Mask RCNN,和R-FCN等,以及各種新型框架,從而大大加快檢測技術钻研的效能。
此表,商湯科技團隊還參加了視覺目標跟蹤大賽VOT Challenge,並在實時跟蹤項目獲得第一名,這一成績體現了商湯在視覺目標跟蹤技術的新突破。
VOT Challenge是視覺目標跟蹤領域一年一度的國際權威比賽,其為跟蹤領域提供了精細的數據標注和評測方式,並在2017年引入了實時比賽:被評測算法在跟蹤物體的同時必須维持至少60fps跟蹤速度,來模擬現實場景中的跟蹤情況。
今年的VOT 2018在ECCV 2018期間舉辦,共有72只隊伍參賽,蕴含微軟亞洲钻研院、牛津大學等驰名企業與高校。商湯科技的參賽算法能夠在60FPS的速度下獲得精確的跟蹤結果,並且在其他兩項項目(通常跟蹤和長時跟蹤)也獲得了驕人的成績。
舉辦新型大賽 推動人为智能行業發展
商湯不止於在頂級計算機視覺大賽上獲得好成績,還致力舉辦行業大賽,造订行業標準,推動人为智能行業發展。
今年8月,商湯科技攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡稱:WIDER Challenge)挑戰賽獲得圓滿成功。作為一項全新的全球頂級計算機視覺競賽,共吸引來自世界各國超過400支隊伍報名。
商湯作為主辦方造订了全新標準數據集——WIDER Face數據集、WIDER Pedestrian專門用於行人檢測的大規模數據集和WIDER Person Search人物檢索數據集,促進高机能算法湧現。
未來,商湯將繼續賦能AI創新大賽,加快推進以人为智能為主题的創新技術,帶動行業應用和產業融合的持續深刻。






返回