Python利用三層神經網(wǎng)絡實現(xiàn)手寫數(shù)字分類詳解

更新時間：2021年11月30日 09:59:54 作者：椰麥吸

這篇文章主要介紹了如何設計一個三層神經網(wǎng)絡模型來實現(xiàn)手寫數(shù)字分類。本文給大家介紹的非常詳細，感興趣的小伙伴快來跟小編一起學習一下

前言

本文做的是基于三層神經網(wǎng)絡實現(xiàn)手寫數(shù)字分類，神經網(wǎng)絡設計是設計復雜深度學習算法應用的基礎，本文將介紹如何設計一個三層神經網(wǎng)絡模型來實現(xiàn)手寫數(shù)字分類。首先介紹如何利用高級編程語言Python搭建神經網(wǎng)絡訓練和推斷框架來實現(xiàn)手寫數(shù)字分類的訓練和使用。

本文實驗文檔下載

一、神經網(wǎng)絡組成

一個完整的神經網(wǎng)絡通常由多個基本的網(wǎng)絡層堆疊而成。本實驗中的三層全連接神經網(wǎng)絡由三個全連接層構成，在每兩個全連接層之間會插入ReLU激活函數(shù)引入非線性變換，最后使用Softmax層計算交叉嫡損失，如下圖所示。因此本實驗中使用的基本單元包括全連接層、ReLU激活函數(shù)、Softmax損失函數(shù)。

二、代碼實現(xiàn)

1.引入庫

import numpy as np
import struct
import os

2.導入數(shù)據(jù)集

MNIST_DIR = "mnist_data"
TRAIN_DATA = "train-images-idx3-ubyte"
TRAIN_LABEL = "train-labels-idx1-ubyte"
TEST_DATA = "t10k-images-idx3-ubyte"
TEST_LABEL = "t10k-labels-idx1-ubyte"

數(shù)據(jù)集鏈接

數(shù)據(jù)集下載后一定記得解壓

3.全連接層

class FullyConnectedLayer(object):
    def __init__(self, num_input, num_output):  # 全連接層初始化
        self.num_input = num_input
        self.num_output = num_output
    def init_param(self, std=0.01):  # 參數(shù)初始化
        self.weight = np.random.normal(loc=0, scale=std, size=(self.num_input, self.num_output))
        self.bias = np.zeros([1, self.num_output])
    def forward(self, input):  # 前向傳播計算
        self.input = input
        self.output = np.dot(self.input,self.weight)+self.bias
        return self.output
    def backward(self, top_diff):  # 反向傳播的計算
        self.d_weight =np.dot(self.input.T,top_diff) 
        self.d_bias = top_diff #
        bottom_diff = np.dot(top_diff,self.weight.T) 
        return bottom_diff
    def update_param(self, lr):  # 參數(shù)更新
        self.weight = self.weight - lr * self.d_weight   
        self.bias = self.bias - lr * self.d_bias    
    def load_param(self, weight, bias):  # 參數(shù)加載
        assert self.weight.shape == weight.shape
        assert self.bias.shape == bias.shape
        self.weight = weight
        self.bias = bias
    def save_param(self):  # 參數(shù)保存
        return self.weight, self.bias

4.ReLU激活函數(shù)層

class ReLULayer(object):
    def forward(self, input):  # 前向傳播的計算
        self.input = input
        output = np.maximum(self.input,0)  
        return output
    def backward(self, top_diff):  # 反向傳播的計算
        b = self.input
        b[b>0] =1
        b[b<0] = 0
        bottom_diff = np.multiply(b,top_diff)
        return bottom_diff

5.Softmax損失層

class SoftmaxLossLayer(object):
    def forward(self, input):  # 前向傳播的計算
        input_max = np.max(input, axis=1, keepdims=True)
        input_exp = np.exp(input- input_max)#(64,10)
        partsum = np.sum(input_exp,axis=1)
        sum = np.tile(partsum,(10,1))
        self.prob = input_exp / sum.T
        return self.prob
    def get_loss(self, label):   # 計算損失
        self.batch_size = self.prob.shape[0]
        self.label_onehot = np.zeros_like(self.prob)
        self.label_onehot[np.arange(self.batch_size), label] = 1.0
        loss = -np.sum(self.label_onehot*np.log(self.prob)) / self.batch_size
        return loss
    def backward(self):  # 反向傳播的計算
        bottom_diff = (self.prob - self.label_onehot)/self.batch_size
        return bottom_diff

6.網(wǎng)絡訓練與推斷模塊

class MNIST_MLP(object):
    def __init__(self, batch_size=64, input_size=784, hidden1=32, hidden2=16, out_classes=10, lr=0.01, max_epoch=1,print_iter=100):
        self.batch_size = batch_size
        self.input_size = input_size
        self.hidden1 = hidden1
        self.hidden2 = hidden2
        self.out_classes = out_classes
        self.lr = lr
        self.max_epoch = max_epoch
        self.print_iter = print_iter

    def shuffle_data(self):
        np.random.shuffle(self.train_data)

    def build_model(self):  # 建立網(wǎng)絡結構
        self.fc1 = FullyConnectedLayer(self.input_size, self.hidden1)
        self.relu1 = ReLULayer()
        self.fc2 = FullyConnectedLayer(self.hidden1, self.hidden2)  
        self.relu2 = ReLULayer()  
        self.fc3 = FullyConnectedLayer(self.hidden2, self.out_classes)
        self.softmax = SoftmaxLossLayer()
        self.update_layer_list = [self.fc1, self.fc2, self.fc3]

    def init_model(self):
        for layer in self.update_layer_list:
            layer.init_param()

    def forward(self, input):  # 神經網(wǎng)絡的前向傳播
        h1 = self.fc1.forward(input)
        h1 = self.relu1.forward(h1)
        h2 = self.fc2.forward(h1)  
        h2 = self.relu2.forward(h2)  
        h3 = self.fc3.forward(h2)  
        self.prob = self.softmax.forward(h3)
        return self.prob

    def backward(self):  # 神經網(wǎng)絡的反向傳播
        dloss = self.softmax.backward()
        dh2 = self.fc3.backward(dloss)  
        dh2 = self.relu2.backward(dh2)  
        dh1 = self.fc2.backward(dh2)
        dh1 = self.relu1.backward(dh1)  
        dh1 = self.fc1.backward(dh1)

    def update(self, lr):
        for layer in self.update_layer_list:
            layer.update_param(lr)

    def load_mnist(self, file_dir, is_images='True'):
        bin_file = open(file_dir, 'rb')
        bin_data = bin_file.read()
        bin_file.close()
        if is_images:
            fmt_header = '>iiii'
            magic, num_images, num_rows, num_cols = struct.unpack_from(fmt_header, bin_data, 0)
        else:
            fmt_header = '>ii'
            magic, num_images = struct.unpack_from(fmt_header, bin_data, 0)
            num_rows, num_cols = 1, 1
        data_size = num_images * num_rows * num_cols
        mat_data = struct.unpack_from('>' + str(data_size) + 'B', bin_data, struct.calcsize(fmt_header))
        mat_data = np.reshape(mat_data, [num_images, num_rows * num_cols])
        return mat_data

    def load_data(self):
        train_images = self.load_mnist(os.path.join(MNIST_DIR, TRAIN_DATA), True)
        train_labels = self.load_mnist(os.path.join(MNIST_DIR, TRAIN_LABEL), False)
        test_images = self.load_mnist(os.path.join(MNIST_DIR, TEST_DATA), True)
        test_labels = self.load_mnist(os.path.join(MNIST_DIR, TEST_LABEL), False)
        self.train_data = np.append(train_images, train_labels, axis=1)
        self.test_data = np.append(test_images, test_labels, axis=1)


    def load_model(self, param_dir):
        params = np.load(param_dir).item()
        self.fc1.load_param(params['w1'], params['b1'])
        self.fc2.load_param(params['w2'], params['b2'])
        self.fc3.load_param(params['w3'], params['b3'])

    def save_model(self, param_dir):
        params = {}
        params['w1'], params['b1'] = self.fc1.save_param()
        params['w2'], params['b2'] = self.fc2.save_param()
        params['w3'], params['b3'] = self.fc3.save_param()
        np.save(param_dir, params)

    def train(self):
        max_batch_1 = self.train_data.shape[0] / self.batch_size
        max_batch = int(max_batch_1)
        for idx_epoch in range(self.max_epoch):
            mlp.shuffle_data()
            for idx_batch in range(max_batch):
                batch_images = self.train_data[idx_batch * self.batch_size:(idx_batch + 1) * self.batch_size, :-1]
                batch_labels = self.train_data[idx_batch * self.batch_size:(idx_batch + 1) * self.batch_size, -1]
                prob = self.forward(batch_images)
                loss = self.softmax.get_loss(batch_labels)
                self.backward()
                self.update(self.lr)
                if idx_batch % self.print_iter == 0:
                    print('Epoch %d, iter %d, loss: %.6f' % (idx_epoch, idx_batch, loss))

    def evaluate(self):
        pred_results = np.zeros([self.test_data.shape[0]])
        for idx in range(int(self.test_data.shape[0] / self.batch_size)):
            batch_images = self.test_data[idx * self.batch_size:(idx + 1) * self.batch_size, :-1]
            prob = self.forward(batch_images)
            pred_labels = np.argmax(prob, axis=1)
            pred_results[idx * self.batch_size:(idx + 1) * self.batch_size] = pred_labels
        accuracy = np.mean(pred_results == self.test_data[:, -1])
        print('Accuracy in test set: %f' % accuracy)

7.完整流程

if __name__ == '__main__':
    h1, h2, e = 128, 64, 20
    mlp = MNIST_MLP(hidden1=h1, hidden2=h2,max_epoch=e)
    mlp.load_data()
    mlp.build_model()
    mlp.init_model()
    mlp.train()
    mlp.save_model('mlp-%d-%d-%depoch.npy' % (h1,h2,e))
    mlp.load_model('mlp-%d-%d-%depoch.npy' % (h1, h2, e))
    mlp.evaluate()

三、代碼debug

pycharm在初次運行時，會在以下代碼報錯：

mlp.load_model('mlp-%d-%d-%depoch.npy' % (h1, h2, e))

ValueError: Object arrays cannot be loaded when allow_pickle=False

經過上網(wǎng)查看原因后，發(fā)現(xiàn)是numpy版本太高引起

解決方法：

點擊報錯處，進入源代碼（.py），注釋掉693行：

#if not allow_pickle:
    #raise ValueError("Object arrays cannot be loaded when "
                   #  "allow_pickle=False")
 
    # Now read the actual data.
    if dtype.hasobject:
        # The array contained Python objects. We need to unpickle the data.
        #if not allow_pickle:
            #raise ValueError("Object arrays cannot be loaded when "
                           #  "allow_pickle=False")
        if pickle_kwargs is None:
            pickle_kwargs = {}
        try:
            array = pickle.load(fp, **pickle_kwargs)
        except UnicodeError as err:
            if sys.version_info[0] >= 3:
                # Friendlier error message

四、結果展示

在不改變網(wǎng)絡結構的條件下我通過自行調節(jié)參數(shù)主要體現(xiàn)在：

if __name__ == '__main__':
    h1, h2, e = 128, 64, 20

class MNIST_MLP(object):
    def __init__(self, batch_size=64, input_size=784, hidden1=32, hidden2=16, out_classes=10, lr=0.01, max_epoch=1,print_iter=100):

為了提高準確率，當然你可以從其他方面進行修改，以下是我得出的輸出結果：

補充

ValueError: Object arrays cannot be loaded when allow_pickle=False解決方案

在讀.npz文件時報下面錯誤：

population_data=np.load("./data/populations.npz")
print(population_data.files)#里面有兩個數(shù)組   data  feature_names
data=population_data['data']
print(data)
print(population_data['feature_names'])

報錯：

['data', 'feature_names']
Traceback (most recent call last):
  File "E:/pycharm file/使用scikit-learn構建模型/構建一元線性模型.py", line 32, in <module>
    data=population_data['data']
  File "E:\pycharm file\venv\lib\site-packages\numpy\lib\npyio.py", line 262, in __getitem__
    pickle_kwargs=self.pickle_kwargs)
  File "E:\pycharm file\venv\lib\site-packages\numpy\lib\format.py", line 692, in read_array
    raise ValueError("Object arrays cannot be loaded when "
ValueError: Object arrays cannot be loaded when allow_pickle=False

報錯為：numpy版本太高，我用的是1.16.3，應該降級為1.16.2

兩種解決方案：

Numpy 1.16.3幾天前發(fā)布了。從發(fā)行版本中說明：“函數(shù)np.load（）和np.lib.format.read_array（）采用allow_pickle關鍵字，現(xiàn)在默認為False以響應CVE-2019-6446 < nvd.nist.gov/vuln/detail / CVE-2019-6446 >“。降級到1.16.2對我有幫助，因為錯誤發(fā)生在一些library內部

第一種：點擊報錯處，進入源代碼（.py），注釋掉693行：

#if not allow_pickle:
    #raise ValueError("Object arrays cannot be loaded when "
                   #  "allow_pickle=False")
 
    # Now read the actual data.
    if dtype.hasobject:
        # The array contained Python objects. We need to unpickle the data.
        #if not allow_pickle:
            #raise ValueError("Object arrays cannot be loaded when "
                           #  "allow_pickle=False")
        if pickle_kwargs is None:
            pickle_kwargs = {}
        try:
            array = pickle.load(fp, **pickle_kwargs)
        except UnicodeError as err:
            if sys.version_info[0] >= 3:
                # Friendlier error message

修改后成功解決了問題，但改掉源碼不知道會不會有后遺癥

第二種：降級numpy版本

pip install numpy==1.16.2

上述兩種方法都可以成功解決報錯問題

以上就是Python利用三層神經網(wǎng)絡實現(xiàn)手寫數(shù)字分類詳解的詳細內容，更多關于Python 的資料請關注腳本之家其它相關文章！

您可能感興趣的文章:

Python設計模式之MVC模式簡單示例
這篇文章主要介紹了Python設計模式之MVC模式,簡單介紹了MVC模式的概念、原理,并結合實例形式給出了Python實現(xiàn)與使用MVC模式的相關操作技巧,需要的朋友可以參考下
2018-01-01
詳解使用python3.7配置開發(fā)釘釘群自定義機器人(2020年新版攻略)
這篇文章主要介紹了詳解使用python3.7配置開發(fā)釘釘群自定義機器人(2020年新版攻略)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-04-04
python程序中調用其他程序的實現(xiàn)
本文主要介紹了python程序中調用其他程序的實現(xiàn)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2023-02-02
Python從MP3文件獲取id3的方法
這篇文章主要介紹了Python從MP3文件獲取id3的方法,實例分析了Python操作文件屬性的相關技巧,需要的朋友可以參考下
2015-06-06
Python 如何讀取字典的所有鍵-值對
這篇文章主要介紹了Python 讀取字典的所有鍵-值對操作，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2021-05-05
python實現(xiàn)隨機漫步方法和原理
在本篇文章里小編給大家整理了關于python如何實現(xiàn)隨機漫步的相關知識點內容，需要的朋友們學習下。
2019-06-06
Python 錯誤和異常代碼詳解
這篇文章主要介紹了Python 錯誤和異常代碼詳解，分享了相關代碼示例，小編覺得還是挺不錯的，具有一定借鑒價值，需要的朋友可以參考下
2018-01-01
淺析Python 字符編碼與文件處理
這篇文章主要介紹了Python 字符編碼與文件處理的相關資料，幫助大家更好的理解和學習python，感興趣的朋友可以了解下
2020-09-09
Tensorflow訓練模型默認占滿所有GPU的解決方案
這篇文章主要介紹了Tensorflow訓練模型默認占滿所有GPU的解決方案，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-05-05
OpenCV半小時掌握基本操作之傅里葉變換
這篇文章主要介紹了OpenCV基本操作之傅里葉變換，本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2021-09-09

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

軟件下載

源碼下載

軟件編程

網(wǎng)絡編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

Python利用三層神經網(wǎng)絡實現(xiàn)手寫數(shù)字分類詳解

目錄

前言

一、神經網(wǎng)絡組成

二、代碼實現(xiàn)

1.引入庫

2.導入數(shù)據(jù)集

3.全連接層

4.ReLU激活函數(shù)層

5.Softmax損失層

6.網(wǎng)絡訓練與推斷模塊

三、代碼debug

四、結果展示

補充

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

Python利用三層神經網(wǎng)絡實現(xiàn)手寫數(shù)字分類詳解

目錄

前言

一、神經網(wǎng)絡組成

二、代碼實現(xiàn)

1.引入庫

2.導入數(shù)據(jù)集

3.全連接層

4.ReLU激活函數(shù)層

5.Softmax損失層

6.網(wǎng)絡訓練與推斷模塊

三、代碼debug

四、結果展示

補充

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

一、神經網(wǎng)絡組成

二、代碼實現(xiàn)

四、結果展示