中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

圖像數(shù)據(jù)增強方法一覽(附python代碼)

2018-09-27    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

在圖像分類任務中,圖像數(shù)據(jù)增強一般是大多數(shù)人會采用的方法之一,這是由于深度學習對數(shù)據(jù)集的大小有一定的要求,若原始的數(shù)據(jù)集比較小,無法很好地滿足網(wǎng)絡模型的訓練,從而影響模型的性能,而圖像增強是對原始圖像進行一定的處理以擴充數(shù)據(jù)集,能夠在一定程度上提升模型的性能。

本文是我目前正在研究一項內(nèi)容,總結圖像數(shù)據(jù)增強的一些方法及其有效性。本研究的目的是學習如何增加訓練數(shù)據(jù)集的大小,通過有限或少量數(shù)據(jù)來訓練獲得具有魯棒性的卷積網(wǎng)絡模型。

這項研究要求列出我們可以想到的所有圖像增強方法,并列舉出所有這些組合,以嘗試和改善圖像分類模型的性能。那么,能夠想到的一些最簡單的增強方法有翻轉、平移、旋轉、縮放,分離單個r、g、b三個顏色通道以及添加噪聲。更激動人心的增強方法是比較熱門的使用生成對抗網(wǎng)絡模型,有時交替使用遺傳算法和生成對抗網(wǎng)絡。此外,還提出了一些創(chuàng)造性方法,例如將類似于Instagram中的高亮濾鏡應用于圖像、應用隨機區(qū)域銳化濾鏡,以及基于聚類技術添加平均圖像等。本文將展示如何使用NumPy對圖像進行擴充。

下面是上述提到的增強技術的總結及說明,如果你能想到其它任何方法來增強圖像,并可以提高圖像分類器的性能,請在留言區(qū)評論。

 

 

原始圖像

增強

所有的數(shù)據(jù)增強都是在沒有OpenCV庫的情況下,使用Numpy完成。

 

 

翻轉|Flipping

對圖像進行翻轉是最流行的圖像數(shù)據(jù)增強方法之一。這主要是由于翻轉圖像操作的代碼簡單,以及對于大多數(shù)問題而言,對圖像進行翻轉操作能夠提升模型的性能。下面的模型可以被認為是看到左鞋而不是右鞋,因此通過這種數(shù)據(jù)增加,模型對于看到鞋的潛在變化會變得更加魯棒。

 

 

 

 

平移|Translations

很容易想象對完成檢測任務的分類器進行平移增強能夠提升其性能,好像這個分類模型試圖檢測鞋子何時在圖像中而不是是否在圖像中。這些平移操作將有助于它在無法看清整個鞋子的情況下認出鞋子來。

 

左移

 

 

 

 

 

右移

 

 

 

 

上移

 

 

 

 

下移

 

 

加噪|Noise

對圖像加噪音是一種有趣的圖像增強技術,現(xiàn)在我開始對這類操作變得更加熟悉。我已經(jīng)看過很多關于對抗網(wǎng)絡訓練的有趣論文,當將一些噪音加入到圖像后,模型無法對圖像進行正確分類。我仍然在尋找能產(chǎn)生比下圖更好的加噪方法。添加噪聲可能有助于使得畸變更加明顯,并使得模型更加魯棒。

 

 

加噪

 

 

生成對抗網(wǎng)絡|GAN:

我閱讀了很多關于生成對抗網(wǎng)絡的文獻,文獻中很多都使用生成對抗網(wǎng)絡進行數(shù)據(jù)增強,我對此也比較感興趣,下面是我使用MNIST數(shù)據(jù)集生成的一些圖像。

 

 

GAN生成圖像

正如我們從上圖中看到的,它們確實看起來像數(shù)字3、7和9,但實際上,將其送進數(shù)字手寫體分類器中,它們并不能被識別為對應的數(shù)字。

感謝你閱讀本文,希望你現(xiàn)在知道如何實現(xiàn)對基本數(shù)據(jù)進行擴充,以改進自己搭建的分類模型!

Connor Shorten,對深度學習、算法理論和生物信息學感興趣

文章原標題《Image Augmentation Examples in Python》,譯者:海棠

標簽: 代碼 網(wǎng)絡

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:工信部公示2018年大數(shù)據(jù)產(chǎn)業(yè)發(fā)展試點示范項目(附名單)

下一篇:對話星展銀行首席分析官:傳統(tǒng)銀行數(shù)據(jù)團隊建設需要“翻譯”