小編給大家分享一下Python基于Tensor FLow進行圖像處理操作的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
Python主要應用于:1、Web開發;2、數據科學研究;3、網絡爬蟲;4、嵌入式應用開發;5、游戲開發;6、桌面應用開發。
具體如下:
在對圖像進行深度學習時,有時可能圖片的數量不足,或者希望網絡進行更多的學習,這時可以對現有的圖片數據進行處理使其變成一張新的圖片,在此基礎上進行學習,從而提高網絡識別的準確率。
利用matplot庫可以方便簡潔地在jupyter內對圖片進行繪制與輸出,首先通過tf.gfile打開圖片文件,并利用函數tf.image.decode_jpeg將jpeg圖片解碼為三位矩陣,之后便可以通過matplot繪制與顯示圖片信息了
import matplotlib.pyplot as plt import tensorflow as tf import numpy as np #讀取圖像文件 image_raw=tf.gfile.GFile('D:\Temp\MachineLearning\data\cat.jpeg','rb').read() with tf.Session() as sess: #對jpeg圖像解碼得到圖像的三位矩陣數據 image_data=tf.image.decode_jpeg(image_raw) print(image_data.eval()) plt.imshow(image_data.eval()) plt.show()
可以看到打印的圖片三維矩陣信息和顯示的圖片:
tensorflow還自帶了許多圖像處理函數,比如resize_image對圖片進行大小的縮放。其中第一個參數代表圖片數據源,第二個數組代表縮放后的大小,第三個method代表采用的縮放方法,默認0是雙線性插值法,1代表最近鄰插值法,2代表雙立方插值法,3代表像素區域插值法。
#對圖片大小進行縮放 image_resize=tf.image.resize_images(image_data,[500,500],method=0) #tensorflow處理后的圖片是float32格式的,需要轉化為uint8才能正確輸出 image_resize=np.asarray(image_resize.eval(),dtype='uint8') plt.imshow(image_resize) plt.show()
函數tf.image.resize_image_with_crop_or_pad可以在保證圖片原始比例的條件下對圖片進行裁切或填充。
函數tf.image.random_crop是隨機對圖片進行選取裁剪,而不是以中心。
#圖片裁剪 image_crop=tf.image.resize_image_with_crop_or_pad(image_data,500,500) plt.imshow(image_crop.eval()) plt.show() #隨機裁剪 img_random=tf.image.random_crop(image_data,[300,300,3]) plt.imshow(img_random.eval()) plt.show()
resize_image_with_crop_or_pad第一個參數是圖片資源,后兩個參數是裁切后的圖片大小,當原始圖片大于目標值時將裁去兩邊多余部分,當圖片小于目標值時將用黑色填充,例如上圖左右被裁剪,上下用黑色填充。
random_crop第一個參數是圖片資源,第二個參數是一個三位張量,代表目標圖像大小。
通過函數實現圖片的上下、左右翻轉,在模型訓練時,可以將原本的樣本圖片進行反轉,作為新的特征值進行輸入供模型訓練。
#上下翻轉 img_down=tf.image.flip_up_down(image_data) plt.imshow(img_down.eval()) plt.show() #左右翻轉 img_left=tf.image.flip_left_right(image_data) plt.imshow(img_left.eval()) plt.show()
通過tf.image.adjust_contrast可以對圖像對比度進行調整,當參數大于1代表加深,小于1代表減淡
tf.image.random_contrast可以在指定范圍內隨即調整對比度
類似的還有adjust_brightness、adjust_saturation、adjust_hue對明度、飽和度、色相進行調整
#加深對比度 img_deep=tf.image.adjust_contrast(image_data,2) plt.imshow(img_deep.eval()) plt.show() #降低對比度 img_fade=tf.image.adjust_contrast(image_data,0.5) plt.imshow(img_fade.eval()) plt.show() #隨機對比度 img_contrast=tf.image.random_contrast(image_data,0.5,2) plt.imshow(img_contrast.eval()) plt.show()
Vgg網絡訓練中傳入的圖片參數x_img是以batch_size為單位的四維數據,例如傳入20張32×32的3通道圖片,其數據為[20,32,32,3]。但是tensorflow的圖片處理函數只可以處理三維的單張圖片。因此需要首先通過split()函數將20張圖片拆分成單張[1,32,32,3],再通過reshape()函數轉化為三維數據[32,32,3],之后再調用圖片處理函數對圖片進行處理,將處理后的圖片恢復成四維,然后放在數組res_arr中,拼接成原來的一組20×32×32×3的數據。
# 將一批batch_size張圖片在第一維上切分為單張圖片 img_arr=tf.split(x_img,batch_size,axis=0) res_arr=[] # 遍歷每個圖片對其進行處理 for img in img_arr: # 將單張四維的圖片[1,32,32,3]處理成三維[32,32,3] img=tf.reshape(img,[32,32,3]) # 對單張圖片進行圖像增強 img_flip=tf.image.random_flip_left_right(img) # 翻轉圖片 img_bright=tf.image.random_brightness(img_flip,max_delta=63) # 隨機調整亮度 img_contrast=tf.image.random_contrast(img_bright,lower=0.2, upper=1.8) # 調整對比度 # 將增強后的圖片再變回原來的四維格式 img=tf.reshape(img_contrast,[1,32,32,3]) # 將每個處理后的圖片放在一個數組 res_arr.append(img) # 將處理后的單個圖片重新拼接在一起 img_aug=tf.concat(res_arr,axis=0)
以上是“Python基于Tensor FLow進行圖像處理操作的示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。