Keras預訓練的ImageNet模型實現(xiàn)分類操作

更新時間：2020年07月07日 10:08:34 作者：cchangcs 公眾號： hw_cch

這篇文章主要介紹了Keras預訓練的ImageNet模型實現(xiàn)分類操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

本文主要介紹通過預訓練的ImageNet模型實現(xiàn)圖像分類，主要使用到的網絡結構有：VGG16、InceptionV3、ResNet50、MobileNet。

代碼：

import keras
import numpy as np
from keras.applications import vgg16, inception_v3, resnet50, mobilenet
 
# 加載模型
vgg_model = vgg16.VGG16(weights='imagenet')
inception_model = inception_v3.InceptionV3(weights='imagenet')
resnet_model = resnet50.ResNet50(weights='imagenet')
mobilenet_model = mobilenet.MobileNet(weights='imagenet')
 
# 導入所需的圖像預處理模塊
from keras.preprocessing.image import load_img
from keras.preprocessing.image import img_to_array
from keras.applications.imagenet_utils import decode_predictions
import matplotlib.pyplot as plt
%matplotlib inline
 
filename= 'images/cat.jpg'
 
# 將圖片輸入到網絡之前執(zhí)行預處理
'''
1、加載圖像，load_img
2、將圖像從PIL格式轉換為Numpy格式，image_to_array
3、將圖像形成批次，Numpy的expand_dims
'''
# 以PIL格式加載圖像
original = load_img(filename, target_size=(224, 224))
print('PIL image size', original.size)
plt.imshow(original)
plt.show()
 
# 將輸入圖像從PIL格式轉換為Numpy格式
# In PIL-- 圖像為（width, height, channel）
# In Numpy——圖像為（height, width, channel）
numpy_image = img_to_array(original)
plt.imshow(np.uint8(numpy_image))
plt.show()
print('numpy array size', numpy_image.size)
 
# 將圖像/圖像轉換為批量格式
# expand_dims將為特定軸上的數(shù)據添加額外的維度
# 網絡的輸入矩陣具有形式（批量大小，高度，寬度，通道）
# 因此，將額外的維度添加到軸0。
image_batch = np.expand_dims(numpy_image, axis=0)
print('image batch size', image_batch.shape)
plt.imshow(np.uint8(image_batch[0]))
 
# 使用各種網絡進行預測
# 通過從批處理中的圖像的每個通道中減去平均值來預處理輸入。 
# 平均值是通過從ImageNet獲得的所有圖像的R，G，B像素的平均值獲得的三個元素的陣列
# 獲得每個類的發(fā)生概率
# 將概率轉換為人類可讀的標簽
# VGG16 網絡模型
# 對輸入到VGG模型的圖像進行預處理
processed_image = vgg16.preprocess_input(image_batch.copy())
 
# 獲取預測得到的屬于各個類別的概率
predictions = vgg_model.predict(processed_image)
# 輸出預測值
# 將預測概率轉換為類別標簽
# 缺省情況下將得到最有可能的五種類別
label_vgg = decode_predictions(predictions)
label_vgg
 
# ResNet50網絡模型
# 對輸入到ResNet50模型的圖像進行預處理
processed_image = resnet50.preprocess_input(image_batch.copy())
 
# 獲取預測得到的屬于各個類別的概率
predictions = resnet_model.predict(processed_image)
 
# 將概率轉換為類標簽
# 如果要查看前3個預測，可以使用top參數(shù)指定它
label_resnet = decode_predictions(predictions, top=3)
label_resnet
 
# MobileNet網絡結構
# 對輸入到MobileNet模型的圖像進行預處理
processed_image = mobilenet.preprocess_input(image_batch.copy())
 
# 獲取預測得到屬于各個類別的概率
predictions = mobilenet_model.predict(processed_image)
 
# 將概率轉換為類標簽
label_mobilnet = decode_predictions(predictions)
label_mobilnet
 
# InceptionV3網絡結構
# 初始網絡的輸入大小與其他網絡不同。 它接受大小的輸入（299,299）。
# 因此，根據它加載具有目標尺寸的圖像。
# 加載圖像為PIL格式
original = load_img(filename, target_size=(299, 299))
 
# 將PIL格式的圖像轉換為Numpy數(shù)組
numpy_image = img_to_array(original)
 
# 根據批量大小重塑數(shù)據
image_batch = np.expand_dims(numpy_image, axis=0)
 
# 將輸入圖像轉換為InceptionV3所能接受的格式
processed_image = inception_v3.preprocess_input(image_batch.copy())
 
# 獲取預測得到的屬于各個類別的概率
predictions = inception_model.predict(processed_image)
 
# 將概率轉換為類標簽
label_inception = decode_predictions(predictions)
label_inception
 
import cv2
numpy_image = np.uint8(img_to_array(original)).copy()
numpy_image = cv2.resize(numpy_image,(900,900))
 
cv2.putText(numpy_image, "VGG16: {}, {:.2f}".format(label_vgg[0][0][1], label_vgg[0][0][2]) , (350, 40), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "MobileNet: {}, {:.2f}".format(label_mobilenet[0][0][1], label_mobilenet[0][0][2]) , (350, 75), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "Inception: {}, {:.2f}".format(label_inception[0][0][1], label_inception[0][0][2]) , (350, 110), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "ResNet50: {}, {:.2f}".format(label_resnet[0][0][1], label_resnet[0][0][2]) , (350, 145), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
numpy_image = cv2.resize(numpy_image, (700,700))
cv2.imwrite("images/{}_output.jpg".format(filename.split('/')[-1].split('.')[0]),cv2.cvtColor(numpy_image, cv2.COLOR_RGB2BGR))
 
plt.figure(figsize=[10,10])
plt.imshow(numpy_image)
plt.axis('off')

訓練數(shù)據：