MLP实现minist数据集分类任务

1. 数据集

minist手写体数字数据集

2. 代码

'''

Description:

Author: zhangyh

Date: 2024-05-04 15:21:49

LastEditTime: 2024-05-04 22:36:26

LastEditors: zhangyh

'''

import numpy as np

class MlpClassifier:

    def __init__(self, input_size, hidden_size1, hidden_size2, output_size, learning_rate=0.01):

        self.input_size = input_size

        self.hidden_size1 = hidden_size1

        self.hidden_size2 = hidden_size2

        self.output_size = output_size

        self.learning_rate = learning_rate

        self.W1 = np.random.randn(input_size, hidden_size1) * 0.01

        self.b1 = np.zeros((1, hidden_size1))

        self.W2 = np.random.randn(hidden_size1, hidden_size2) * 0.01

        self.b2 = np.zeros((1, hidden_size2))

        self.W3 = np.random.randn(hidden_size2, output_size) * 0.01

        self.b3 = np.zeros((1, output_size))

    def softmax(self, x):

        exps = np.exp(x - np.max(x, axis=1, keepdims=True))

        return exps / np.sum(exps, axis=1, keepdims=True)

    def relu(self, x):

        return np.maximum(x, 0)

    def relu_derivative(self, x):

        return np.where(x > 0, 1, 0)

    def cross_entropy_loss(self, y_true, y_pred):

        m = y_true.shape[0]

        return -np.sum(y_true * np.log(y_pred + 1e-8)) / m

    def forward(self, X):

        self.Z1 = np.dot(X, self.W1) + self.b1

        self.A1 = self.relu(self.Z1)

        self.Z2 = np.dot(self.A1, self.W2) + self.b2

        self.A2 = self.relu(self.Z2)

        self.Z3 = np.dot(self.A2, self.W3) + self.b3

        self.A3 = self.softmax(self.Z3)

        return self.A3

    def backward(self, X, y):

        m = X.shape[0]

        dZ3 = self.A3 - y

        dW3 = np.dot(self.A2.T, dZ3) / m

        db3 = np.sum(dZ3, axis=0, keepdims=True) / m

        dA2 = np.dot(dZ3, self.W3.T)

        dZ2 = dA2 * self.relu_derivative(self.Z2)

        dW2 = np.dot(self.A1.T, dZ2) / m

        db2 = np.sum(dZ2, axis=0, keepdims=True) / m

        dA1 = np.dot(dZ2, self.W2.T)

        dZ1 = dA1 * self.relu_derivative(self.Z1)

        dW1 = np.dot(X.T, dZ1) / m

        db1 = np.sum(dZ1, axis=0, keepdims=True) / m

        # Update weights and biases

        self.W3 -= self.learning_rate * dW3

        self.b3 -= self.learning_rate * db3

        self.W2 -= self.learning_rate * dW2

        self.b2 -= self.learning_rate * db2

        self.W1 -= self.learning_rate * dW1

        self.b1 -= self.learning_rate * db1

    # 计算精确度

    def accuracy(self, y_pred, y):

        predictions = np.argmax(y_pred, axis=1)

        correct_predictions = np.sum(predictions == np.argmax(y, axis=1))

        return correct_predictions / y.shape[0] 

    def train(self, X, y, epochs=100, batch_size=64):

        print('Training...')

        m = X.shape[0]

        for epoch in range(epochs):

            for i in range(0, m, batch_size):

                X_batch = X[i:i+batch_size]

                y_batch = y[i:i+batch_size]

                # Forward propagation

                y_pred = self.forward(X_batch)

                # Backward propagation

                self.backward(X_batch, y_batch)

            if (epoch+1) % 10 == 0:

                loss = self.cross_entropy_loss(y, self.forward(X))

                acc = self.accuracy(y_pred, y_batch)

                print(f'Epoch {epoch+1}/{epochs}, Loss: {loss}, Training-Accuracy: {acc}')   

    def test(self, X, y):

        print('Testing...')

        y_pred = self.forward(X)

        acc = self.accuracy(y_pred, y)

        return acc

if __name__ == '__main__':  

    import tensorflow as tf

    # 加载MNIST数据集

    (X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()

    # 将图像转换为向量形式

    X_train = X_train.reshape(X_train.shape[0], -1) / 255.0

    X_test = X_test.reshape(X_test.shape[0], -1) / 255.0

    # 将标签进行 one-hot 编码

    num_classes = 10

    y_train = tf.keras.utils.to_categorical(y_train, num_classes)

    y_test = tf.keras.utils.to_categorical(y_test, num_classes)

    # 打印转换后的结果

    # 训练集维度: (60000, 784) (60000, 10)

    # 测试集维度: (10000, 784) (10000, 10)

    model = MlpClassifier(784, 128, 128, 10)

    model.train(X_train, y_train)   

    test_acc = model.test(X_test, y_test)

    print(f'Test-Accuracy: {test_acc}')

3. 运行结果

Training...

Epoch 10/100, Loss: 0.3617846299623725, Training-Accuracy: 0.9375

Epoch 20/100, Loss: 0.1946690996652946, Training-Accuracy: 1.0

Epoch 30/100, Loss: 0.13053815227522408, Training-Accuracy: 1.0

Epoch 40/100, Loss: 0.09467908427578901, Training-Accuracy: 1.0

Epoch 50/100, Loss: 0.07120217251250453, Training-Accuracy: 1.0

Epoch 60/100, Loss: 0.055233734086591456, Training-Accuracy: 1.0

Epoch 70/100, Loss: 0.04369171830999816, Training-Accuracy: 1.0

Epoch 80/100, Loss: 0.03469674775956587, Training-Accuracy: 1.0

Epoch 90/100, Loss: 0.027861857647949812, Training-Accuracy: 1.0

Epoch 100/100, Loss: 0.0225212692988995, Training-Accuracy: 1.0

Testing...

Test-Accuracy: 0.9775

MLP实现minist数据集分类任务的更多相关文章

单向LSTM笔记, LSTM做minist数据集分类
单向LSTM笔记, LSTM做minist数据集分类先介绍下torch.nn.LSTM()这个API 1.input_size: 每一个时步(time_step)输入到lstm单元的维度.(实际输入 ...
用CNN及MLP等方法识别minist数据集
用CNN及MLP等方法识别minist数据集 2017年02月13日 21:13:09 hnsywangxin 阅读数:1124更多个人分类: 深度学习.keras.tensorflow.cnn ...
机器学习与Tensorflow（3）—— 机器学习及MNIST数据集分类优化
一.二次代价函数 1. 形式: 其中,C为代价函数,X表示样本,Y表示实际值,a表示输出值,n为样本总数 2. 利用梯度下降法调整权值参数大小,推导过程如下图所示: 根据结果可得,权重w和偏置b的梯度 ...
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = ...
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression 一. 逻辑回归逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题, ...
Python实现鸢尾花数据集分类问题——基于skearn的SVM
Python实现鸢尾花数据集分类问题——基于skearn的SVM 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = 'Xiaoli ...
BP算法在minist数据集上的简单实现
BP算法在minist上的简单实现数据:http://yann.lecun.com/exdb/mnist/ 参考:blog,blog2,blog3,tensorflow 推导:http://www. ...
TensorFlow笔记三：从Minist数据集出发两种经典训练方法
Minist数据集:MNIST_data 包含四个数据文件一.方法一:经典方法 tf.matmul(X,w)+b import tensorflow as tf import numpy as np ...
3.keras-简单实现Mnist数据集分类
keras-简单实现Mnist数据集分类 1.载入数据以及预处理 import numpy as np from keras.datasets import mnist from keras.util ...
6.keras-基于CNN网络的Mnist数据集分类
keras-基于CNN网络的Mnist数据集分类 1.数据的载入和预处理 import numpy as np from keras.datasets import mnist from keras. ...

随机推荐

DevEco Hvigor高效编译，构建过程新秘籍
作者:Lewei,华为终端BG编译构建技术专家 DevEco Hvigor是使用TypeScript语言开发的全新轻量化的任务调度工具,针对HarmonyOS应用提供了一系列编译构建任务,支持将H ...
redis命令和lua实现分布式锁
Redis分布式锁关键 SETNX 语法: SETNX key value 如果key不存在,则存储(key:value)值,返回1 如果key已经不存在,则不执行操作,返回0 因为这个命令的性质,多 ...
【笔记】go语言--go语言的依赖管理
[笔记]go语言--go语言的依赖管理 GO语言的依赖管理依赖的概念,依赖就是第三方的库,即别人已经做好的库依赖管理的三个阶段 GOPATH,GOVENDOR, go mod 三个阶段 - GOP ...
RocketMQ 之 IoT 消息解析：物联网需要什么样的消息技术?
前言: 从初代开源消息队列崛起,到 PC 互联网.移动互联网爆发式发展,再到如今 IoT.云计算.云原生引领了新的技术趋势,消息中间件的发展已经走过了 30 多个年头. 目前,消息中间件在国内许多行业 ...
科学地花钱：基于端智能的在线红包分配方案 (CIKM2020)
简介: 红包是电商平台重要的用户运营手段,本文将介绍1688基于端智能技术开发的two-stage红包分发方案.这一方案持续在线上生效,相较于原有算法有明显提升. 一.前言本文是作者在1688进行新 ...
源码解读：KubeVela 是如何将 appfile 转换为 K8s 特定资源对象的
简介: KubeVela 是一个简单易用又高度可扩展的云原生应用管理引擎,是基于 Kubernetes 及阿里云与微软云共同发布的云原生应用开发模型 OAM 构建.本文主要目的是探索 KubeVela ...
消息队列 RocketMQ 遇上可观测：业务核心链路可视化
简介:本篇文章主要介绍 RocketMQ 的可观测性工具在线上生产环境的最佳实践.RocketMQ的可观测性能力领先业界同类产品,RocketMQ 的 Dashboard 和消息轨迹等功能为业务核心 ...
[Trading] 日间交易中的成交量分析 - 使用成交量趋势来提高你的效果
在交易中,成交量代表在特定时期内股票或期货合约的易手单位数量. 交易员将其作为一个关键指标,因为它让他们知道资产的流动性水平,以及他们在接近当前价格的情况下买入或卖出头寸的容易程度,这可能是一个移动的 ...
dotnet 提升 ToUpper 性能
在应用软件启动过程中,客户端应用软件是对性能敏感的.比如在解析命令行参数的时候,有时候需要进行字符串处理逻辑.一般来说命令行参数都是语言文化无关的,在需要进行全大写或全小写转换过程中,采用 ToUpp ...
VisualStudio 调试时会不断刷新 WPF 应用渲染
在 VisualStudio 附加调试和没有用 VisualStudio 附加调试时,对应用程序是有不同的影响,如 VisualStudio 设计器将会在附加调试 WPF 应用的时候,不断刷新 WPF ...

MLP实现minist数据集分类任务

MLP实现minist数据集分类任务的更多相关文章

随机推荐

热门专题