TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别（MNIST）

从这篇文章开始，终于要干点正儿八经的工作了，前面都是准备工作。这次我们要解决机器学习的经典问题，MNIST手写数字识别。

首先介绍一下数据集。请首先解压：TF_Net\Asset\mnist_png.tar.gz文件

文件夹内包括两个文件夹：training和validation，其中training文件夹下包括60000个训练图片validation下包括10000个评估图片，图片为28*28像素，分别放在0~9十个文件夹中。

程序总体流程和上一篇文章介绍的BMI分析程序基本一致，毕竟都是多元分类，有几点不一样。

1、BMI程序的特征数据（输入）为一维数组，包含两个数字，MNIST的特征数据为28*28的二位数组；

2、BMI程序的输出为3个，MNIST的输出为10个；

网络模型构建如下：

        private readonly int img_rows = 28;

        private readonly int img_cols = 28;

        private readonly int num_classes = 10;  // total classes

        /// <summary>

        /// 构建网络模型

        /// </summary>

        private Model BuildModel()

        {

            // 网络参数

            int n_hidden_1 = 128;    // 1st layer number of neurons.

            int n_hidden_2 = 128;    // 2nd layer number of neurons.

            float scale = 1.0f / 255;

            var model = keras.Sequential(new List<ILayer>

            {

                keras.layers.InputLayer((img_rows,img_cols)),

                keras.layers.Flatten(),

                keras.layers.Rescaling(scale),

                keras.layers.Dense(n_hidden_1, activation:keras.activations.Relu),

                keras.layers.Dense(n_hidden_2, activation:keras.activations.Relu),

                keras.layers.Dense(num_classes, activation:keras.activations.Softmax)

            });

            return model;

        }

这个网络里用到了两个新方法，需要解释一下：

1、Flatten方法：这里表示拉平，把28*28的二维数组拉平为含784个数据的一维数组，因为二维数组无法进行运算；

2、Rescaling 方法：就是对每个数据乘以一个系数，因为我们从图片获取的数据为每一个位点的灰度值，其取值范围为0~255，所以乘以一个系数将数据缩小到1以内，以免后面运算时溢出。

其它基本和上一篇文章介绍的差不多，全部代码如下：

    /// <summary>

    /// 通过神经网络来实现多元分类

    /// </summary>

    public class NN_MultipleClassification_BMI

    {

        private readonly Random random = new Random(1);

        // 网络参数

        int num_features = 2; // data features

        int num_classes = 3;  // total output .

        public void Run()

        {

            var model = BuildModel();

            model.summary();          

            Console.WriteLine("Press any key to continue...");

            Console.ReadKey();

            (NDArray train_x, NDArray train_y) = PrepareData(1000);

            model.compile(optimizer: keras.optimizers.Adam(0.001f),

              loss: keras.losses.SparseCategoricalCrossentropy(),

              metrics: new[] { "accuracy" });

            model.fit(train_x, train_y, batch_size: 128, epochs: 300);

            test(model);

        }

        /// <summary>

        /// 构建网络模型

        /// </summary>

        private Model BuildModel()

        {

            // 网络参数

            int n_hidden_1 = 64; // 1st layer number of neurons.

            int n_hidden_2 = 64; // 2nd layer number of neurons.           

            var model = keras.Sequential(new List<ILayer>

            {

                keras.layers.InputLayer(num_features),

                keras.layers.Dense(n_hidden_1, activation:keras.activations.Relu),

                keras.layers.Dense(n_hidden_2, activation:keras.activations.Relu),

                keras.layers.Dense(num_classes, activation:keras.activations.Softmax)

            });

            return model;

        }

        /// <summary>

        /// 加载训练数据

        /// </summary>

        /// <param name="total_size"></param>

        private (NDArray, NDArray) PrepareData(int total_size)

        {

            float[,] arrx = new float[total_size, num_features];

            int[] arry = new int[total_size];

            for (int i = 0; i < total_size; i++)

            {

                float weight = (float)random.Next(30, 100) / 100;

                float height = (float)random.Next(140, 190) / 100;

                float bmi = (weight * 100) / (height * height);

                arrx[i, 0] = weight;

                arrx[i, 1] = height;

                switch (bmi)

                {

                    case var x when x < 18.0f:

                        arry[i] = 0;

                        break;

                    case var x when x >= 18.0f && x <= 28.0f:

                        arry[i] = 1;

                        break;

                    case var x when x > 28.0f:

                        arry[i] = 2;

                        break;

                }

            }

            return (np.array(arrx), np.array(arry));

        }

        /// <summary>

        /// 消费模型

        /// </summary>

        private void test(Model model)

        {

            int test_size = 20;

            for (int i = 0; i < test_size; i++)

            {

                float weight = (float)random.Next(40, 90) / 100;

                float height = (float)random.Next(145, 185) / 100;

                float bmi = (weight * 100) / (height * height);

                var test_x = np.array(new float[1, 2] { { weight, height } });

                var pred_y = model.Apply(test_x);

                Console.WriteLine($"{i}:weight={(float)weight} \theight={height} \tBMI={bmi:0.0} \tPred:{pred_y[0].numpy()}");

            }

        }

    }

另有两点说明：

1、由于对图片的读取比较耗时，所以我采用了一个方法，就是把读取到的数据序列化到一个二进制文件中，下次直接从二进制文件反序列化即可，大大加快处理速度。

2、我没有采用validation图片进行评估，只是简单选了20个样本测试了一下。

项目名称：NN_MultipleClassification_MNIST

目录：查看TensorFlow.NET机器学习入门系列目录

TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别（MNIST）的更多相关文章

TensorFlow卷积神经网络实现手写数字识别以及可视化
边学习边笔记 https://www.cnblogs.com/felixwang2/p/9190602.html # https://www.cnblogs.com/felixwang2/p/9190 ...
TensorFlow 之手写数字识别MNIST
官方文档: MNIST For ML Beginners - https://www.tensorflow.org/get_started/mnist/beginners Deep MNIST for ...
BP神经网络的手写数字识别
BP神经网络的手写数字识别 ANN 人工神经网络算法在实践中往往给人难以琢磨的印象,有句老话叫“出来混总是要还的”,大概是由于具有很强的非线性模拟和处理能力,因此作为代价上帝让它“黑盒”化了.作为一种 ...
利用c++编写bp神经网络实现手写数字识别详解
利用c++编写bp神经网络实现手写数字识别写在前面从大一入学开始,本菜菜就一直想学习一下神经网络算法,但由于时间和资源所限,一直未展开比较透彻的学习.大二下人工智能课的修习,给了我一个学习的契机. ...
第二节，TensorFlow 使用前馈神经网络实现手写数字识别
一感知器感知器学习笔记:https://blog.csdn.net/liyuanbhu/article/details/51622695 感知器(Perceptron)是二分类的线性分类模型,其输 ...
5 TensorFlow入门笔记之RNN实现手写数字识别
------------------------------------ 写在开头:此文参照莫烦python教程(墙裂推荐!!!) ---------------------------------- ...
卷积神经网络CNN 手写数字识别
1. 知识点准备在了解 CNN 网络神经之前有两个概念要理解,第一是二维图像上卷积的概念,第二是 pooling 的概念. a. 卷积关于卷积的概念和细节可以参考这里,卷积运算有两个非常重要特性, ...
【机器学习】BP神经网络实现手写数字识别
最近用python写了一个实现手写数字识别的BP神经网络,BP的推导到处都是,但是一动手才知道,会理论推导跟实现它是两回事.关于BP神经网络的实现网上有一些代码,可惜或多或少都有各种问题,在下手写了一 ...
BP神经网络（手写数字识别）
1实验环境实验环境:CPU i7-3770@3.40GHz,内存8G,windows10 64位操作系统实现语言:python 实验数据:Mnist数据集程序使用的数据库是mnist手写数字数据 ...

随机推荐

【模板】单源最短路径（Dijkstra）/洛谷P4779
题目链接 https://www.luogu.com.cn/problem/P4779 题目大意给定一个 \(n\) 个点 \(m\) 条边有向图,每个点有一个非负权值,求从 \(s\) 点出发,到 ...
LeetCode一维数组的动态和
一维数组的动态和题目描述给你一个数组 nums.数组「动态和」的计算公式为:runningSum[i] = sum(nums[0]...nums[i]). 请返回 nums 的动态和. 示例 1: ...
【swift】长按事件绑定，平移滑动事件+坐标获取
为何把这两个事件归类在一起? 我后来才明白,iOS有一个手势事件(UiGestureRecognizer) 事件里有7个功能,不过我只试过前两个,也就是标题的这两个(长按.平移滑动) UILongPr ...
jQuery - 按回车键触发跳转
键盘事件有三种: keyup:按键按下去,抬上来后,事件才生效 (推荐) keydown:按键按下去就生效 keypress:与 keydown 事件类似,当按钮被按下时,会发生该事件,与 keydo ...
使用匿名内部类和lamda的方式创建线程
1.匿名内部类的方式 1 /** 2 *匿名内部类的方式启动线程 3 */ 4 public class T2 { 5 public static void main(String[] args) { ...
使用wesocket从 rabbitMQ获取实时数据
rabbitmq支持stomp组件,通过stomp组件和websocket可以从rabbitMQ获取实时数据.这里分享一个demo: 使用时需要引入的js ,用到了sock.js和stomp.js & ...
『学了就忘』Linux服务管理 — 76、RPM包安装的服务管理
目录 1.独立服务的启动管理 2.独立服务的自启动管理方式一: 方式二:(推荐) 方式三: 3.验证 1.独立服务的启动管理 (1)使用/etc/init.d/目录中的启动脚本启动服务(推荐) [r ...
Mysql资料查询SQL执行顺序
目录一.Mysql数据库查询Sql的执行顺序是什么? 二.具体顺序一.Mysql数据库查询Sql的执行顺序是什么? (9)SELECT (10) DISTINCT column, (6)AGG_F ...
MySQL如何使用coalesce函数
coalesce(a,b,c); 参数说明:如果a==null,则选择b:如果b==null,则选择c:如果a!=null,则选择a:如果a b c 都为null ,则返回为null(没意义)
车载以太网第二弹 | 测试之实锤-IOP测试实践
前言上一期"物理层PMA测试实践",咱们从环境设备组成.被测对象组成再到测试过程和测试结果,将完整的PMA测试过程做了一个经验分享. 由下层开始逐层"披沙沥金" ...

TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别（MNIST）

TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别（MNIST）的更多相关文章

随机推荐

热门专题