Keras預訓練的ImageNet模型實現(xiàn)分類操作
更新時間:2020年07月07日 10:08:34 作者:cchangcs 公眾號: hw_cch
這篇文章主要介紹了Keras預訓練的ImageNet模型實現(xiàn)分類操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
本文主要介紹通過預訓練的ImageNet模型實現(xiàn)圖像分類,主要使用到的網絡結構有:VGG16、InceptionV3、ResNet50、MobileNet。
代碼:
import keras
import numpy as np
from keras.applications import vgg16, inception_v3, resnet50, mobilenet
# 加載模型
vgg_model = vgg16.VGG16(weights='imagenet')
inception_model = inception_v3.InceptionV3(weights='imagenet')
resnet_model = resnet50.ResNet50(weights='imagenet')
mobilenet_model = mobilenet.MobileNet(weights='imagenet')
# 導入所需的圖像預處理模塊
from keras.preprocessing.image import load_img
from keras.preprocessing.image import img_to_array
from keras.applications.imagenet_utils import decode_predictions
import matplotlib.pyplot as plt
%matplotlib inline
filename= 'images/cat.jpg'
# 將圖片輸入到網絡之前執(zhí)行預處理
'''
1、加載圖像,load_img
2、將圖像從PIL格式轉換為Numpy格式,image_to_array
3、將圖像形成批次,Numpy的expand_dims
'''
# 以PIL格式加載圖像
original = load_img(filename, target_size=(224, 224))
print('PIL image size', original.size)
plt.imshow(original)
plt.show()
# 將輸入圖像從PIL格式轉換為Numpy格式
# In PIL-- 圖像為(width, height, channel)
# In Numpy——圖像為(height, width, channel)
numpy_image = img_to_array(original)
plt.imshow(np.uint8(numpy_image))
plt.show()
print('numpy array size', numpy_image.size)
# 將圖像/圖像轉換為批量格式
# expand_dims將為特定軸上的數(shù)據添加額外的維度
# 網絡的輸入矩陣具有形式(批量大小,高度,寬度,通道)
# 因此,將額外的維度添加到軸0。
image_batch = np.expand_dims(numpy_image, axis=0)
print('image batch size', image_batch.shape)
plt.imshow(np.uint8(image_batch[0]))
# 使用各種網絡進行預測
# 通過從批處理中的圖像的每個通道中減去平均值來預處理輸入。
# 平均值是通過從ImageNet獲得的所有圖像的R,G,B像素的平均值獲得的三個元素的陣列
# 獲得每個類的發(fā)生概率
# 將概率轉換為人類可讀的標簽
# VGG16 網絡模型
# 對輸入到VGG模型的圖像進行預處理
processed_image = vgg16.preprocess_input(image_batch.copy())
# 獲取預測得到的屬于各個類別的概率
predictions = vgg_model.predict(processed_image)
# 輸出預測值
# 將預測概率轉換為類別標簽
# 缺省情況下將得到最有可能的五種類別
label_vgg = decode_predictions(predictions)
label_vgg
# ResNet50網絡模型
# 對輸入到ResNet50模型的圖像進行預處理
processed_image = resnet50.preprocess_input(image_batch.copy())
# 獲取預測得到的屬于各個類別的概率
predictions = resnet_model.predict(processed_image)
# 將概率轉換為類標簽
# 如果要查看前3個預測,可以使用top參數(shù)指定它
label_resnet = decode_predictions(predictions, top=3)
label_resnet
# MobileNet網絡結構
# 對輸入到MobileNet模型的圖像進行預處理
processed_image = mobilenet.preprocess_input(image_batch.copy())
# 獲取預測得到屬于各個類別的概率
predictions = mobilenet_model.predict(processed_image)
# 將概率轉換為類標簽
label_mobilnet = decode_predictions(predictions)
label_mobilnet
# InceptionV3網絡結構
# 初始網絡的輸入大小與其他網絡不同。 它接受大小的輸入(299,299)。
# 因此,根據它加載具有目標尺寸的圖像。
# 加載圖像為PIL格式
original = load_img(filename, target_size=(299, 299))
# 將PIL格式的圖像轉換為Numpy數(shù)組
numpy_image = img_to_array(original)
# 根據批量大小重塑數(shù)據
image_batch = np.expand_dims(numpy_image, axis=0)
# 將輸入圖像轉換為InceptionV3所能接受的格式
processed_image = inception_v3.preprocess_input(image_batch.copy())
# 獲取預測得到的屬于各個類別的概率
predictions = inception_model.predict(processed_image)
# 將概率轉換為類標簽
label_inception = decode_predictions(predictions)
label_inception
import cv2
numpy_image = np.uint8(img_to_array(original)).copy()
numpy_image = cv2.resize(numpy_image,(900,900))
cv2.putText(numpy_image, "VGG16: {}, {:.2f}".format(label_vgg[0][0][1], label_vgg[0][0][2]) , (350, 40), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "MobileNet: {}, {:.2f}".format(label_mobilenet[0][0][1], label_mobilenet[0][0][2]) , (350, 75), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "Inception: {}, {:.2f}".format(label_inception[0][0][1], label_inception[0][0][2]) , (350, 110), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
cv2.putText(numpy_image, "ResNet50: {}, {:.2f}".format(label_resnet[0][0][1], label_resnet[0][0][2]) , (350, 145), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 3)
numpy_image = cv2.resize(numpy_image, (700,700))
cv2.imwrite("images/{}_output.jpg".format(filename.split('/')[-1].split('.')[0]),cv2.cvtColor(numpy_image, cv2.COLOR_RGB2BGR))
plt.figure(figsize=[10,10])
plt.imshow(numpy_image)
plt.axis('off')
訓練數(shù)據:

運行結果:

以上這篇Keras預訓練的ImageNet模型實現(xiàn)分類操作就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
淺談PyTorch的數(shù)據讀取機制Dataloader與Dataset
這篇文章主要介紹了淺談PyTorch的數(shù)據讀取機制Dataloader與Dataset,DataLoader的作用是構建一個可迭代的數(shù)據裝載器,每次執(zhí)行循環(huán)的時候,就從中讀取一批Batchsize大小的樣本進行訓練,需要的朋友可以參考下2023-07-07
使用pygame實現(xiàn)垃圾分類小游戲功能(已獲校級二等獎)
這篇文章主要介紹了使用pygame實現(xiàn)垃圾分類小游戲功能(已獲校級二等獎),本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-07-07
Python 如何實現(xiàn)數(shù)據庫表結構同步
這篇文章主要介紹了Python 如何實現(xiàn)數(shù)據庫表結構同步,幫助大家更好的利用python操作數(shù)據庫,感興趣的朋友可以了解下2020-09-09
python單向循環(huán)鏈表原理與實現(xiàn)方法示例
這篇文章主要介紹了python單向循環(huán)鏈表原理與實現(xiàn)方法,結合實例形式詳細分析了Python單向循環(huán)鏈表概念、原理、定義及使用方法,需要的朋友可以參考下2019-12-12
Python爬取OPGG上英雄聯(lián)盟英雄勝率及選取率信息的操作
這篇文章主要介紹了Python爬取OPGG上英雄聯(lián)盟英雄勝率及選取率信息的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-04-04

