亚洲狼人综合,本道综合精品,在线看福利影,国产亚洲精品久久久玫瑰,日韩欧美精品在线观看,日韩在线国产,欧美乱码一区二区三区

干貨 | 目標檢測入門,看這篇就夠了(導(dǎo)言)

2018-03-19 16:57:20 csdn  點擊量: 評論 (0)
近年來,深度學(xué)習(xí)模型逐漸取代傳統(tǒng)機器視覺方法而成為目標檢測領(lǐng)域的主流算法,本系列文章將回顧早期的經(jīng)典工作,并對較新的趨勢做一個全景

近年來,深度學(xué)習(xí)模型逐漸取代傳統(tǒng)機器視覺方法而成為目標檢測領(lǐng)域的主流算法,本系列文章將回顧早期的經(jīng)典工作,并對較新的趨勢做一個全景式的介紹,幫助讀者對這一領(lǐng)域建立基本的認識。

 

導(dǎo)言:目標檢測的任務(wù)表述

 

如何從圖像中解析出可供計算機理解的信息,是機器視覺的中心問題。深度學(xué)習(xí)模型由于其強大的表示能力,加之數(shù)據(jù)量的積累和計算力的進步,成為機器視覺的熱點研究方向。

 

那么,如何理解一張圖片?根據(jù)后續(xù)任務(wù)的需要,有三個主要的層次。

 

 

圖像理解的三個層次

 

一是分類(Classification),即是將圖像結(jié)構(gòu)化為某一類別的信息,用事先確定好的類別(string)或?qū)嵗齀D來描述圖片。這一任務(wù)是最簡單、最基礎(chǔ)的圖像理解任務(wù),也是深度學(xué)習(xí)模型最先取得突破和實現(xiàn)大規(guī)模應(yīng)用的任務(wù)。其中,ImageNet是最權(quán)威的評測集,每年的ILSVRC催生了大量的優(yōu)秀深度網(wǎng)絡(luò)結(jié)構(gòu),為其他任務(wù)提供了基礎(chǔ)。在應(yīng)用領(lǐng)域,人臉、場景的識別等都可以歸為分類任務(wù)。

 

二是檢測(Detection)。分類任務(wù)關(guān)心整體,給出的是整張圖片的內(nèi)容描述,而檢測則關(guān)注特定的物體目標,要求同時獲得這一目標的類別信息和位置信息。相比分類,檢測給出的是對圖片前景和背景的理解,我們需要從背景中分離出感興趣的目標,并確定這一目標的描述(類別和位置),因而,檢測模型的輸出是一個列表,列表的每一項使用一個數(shù)據(jù)組給出檢出目標的類別和位置(常用矩形檢測框的坐標表示)。

 

三是分割(Segmentation)。分割包括語義分割(semantic segmentation)和實例分割(instance segmentation),前者是對前背景分離的拓展,要求分離開具有不同語義的圖像部分,而后者是檢測任務(wù)的拓展,要求描述出目標的輪廓(相比檢測框更為精細)。分割是對圖像的像素級描述,它賦予每個像素類別(實例)意義,適用于理解要求較高的場景,如無人駕駛中對道路和非道路的分割。

 

本系列文章關(guān)注的領(lǐng)域是目標檢測,即圖像理解的中層次。

 
大云網(wǎng)官方微信售電那點事兒

責(zé)任編輯:售電衡衡

免責(zé)聲明:本文僅代表作者個人觀點,與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
我要收藏
個贊
?