关于入门深度学习mnist数据集前向计算的记录

import os

import lr as lr
import tensorflow as tf
from pyspark.sql.functions import stddev
from tensorflow.keras import datasets

os.environ['TF_CPP_MIN_LOG_LEVEL']='2'   #只打印error的信息
(x,y),_=datasets.mnist.load_data()
#x:    [60k,28,28]
#y:    [60k]

x=tf.convert_to_tensor(x,dtype=tf.float32)/255     #使x的值从0~255降到0~1
y=tf.convert_to_tensor(y,dtype=tf.int32)

print(x.shape,y.shape,x.dtype,y.dtype)
print(tf.reduce_min(x),tf.reduce_max(x))
print(tf.reduce_min(y),tf.reduce_max(y))

train_db=tf.data.Dataset.from_tensor_slices((x,y)).batch(100)   #每次从60k中取100张
train_iter=iter(train_db)   #迭代器
sample=next(train_iter)
print('batch:',sample[0].shape,sample[1].shape)

#[b,784]=>[b,256]=>[b,128]=>[b,10]
#[dim_in,dim_out],[dim_out]
w1=tf.Variable(tf.random.truncated_normal([784,256],stddev=0.1))    #防止梯度爆炸，需要设定均值和方差的范围，原来是均值为0，方差为1，现在设置方差为0.1
b1=tf.Variable(tf.zeros([256]))
w2=tf.Variable(tf.random.truncated_normal([256,128],stddev=0.1))
b2=tf.Variable(tf.zeros([128]))
w3=tf.Variable(tf.random.truncated_normal([128,10],stddev=0.1))
b3=tf.Variable(tf.zeros([10]))

#h1=x@w1+b1     x指的是之前的一个batch,100个28*28的图片
for epoch in range(10):     #对整个数据集进行10次迭代
    for step,(x,y) in enumerate(train_db):        # x:[100,28,28]  y:[100]    对每个batch进行，整体进度
        x=tf.reshape(x,[-1,28*28])      #[b,28,28]=>[b,28*28]  维度变换
        with tf.GradientTape() as tape:       #tf.Variable
            h1 = x @ w1 + b1  # [b,784]@[784,256]+[256]=>[b,256]
            h1 = tf.nn.relu(h1)  # 加入非线性因素
            h2 = h1 @ w2 + b2  # [b,256]@[256,128]+[128]=>[b,128]
            h2 = tf.nn.relu(h2)
            out = h2 @ w3 + b3  # [b,128]@[128,10]+[10]=>[b,10]      前项计算结束

            # compute loss
            # out:[b,10]
            # y:[b]=>[b,10]
            y_onehot = tf.one_hot(y, depth=10)   #将y  one_hot编码为长度为10的一维数组，好与x*w+b的[b,10]进行相减误差运算

            # mes=mean(sum(y_onehot-out)^2)
            loss = tf.square(y_onehot - out)
            # mean:scalar
            loss = tf.reduce_mean(loss)     #求均值，就是计算100张图片的平均误差
        #compute gradient
        grads=tape.gradient(loss,[w1,b1,w2,b2,w3,b3])    #loss函数中队w1,b1,w2,b2,w3,b3求导
        # print(grads)
        #w1=w1-lr*w1_grad   求下一个w1，梯度下降算法
        # w1 = w1 - lr * grads[0]      #tf.Variable相减之后还是tf.tensor，需要原地更新
        # b1 = b1 - lr * grads[1]
        # w2 = w2 - lr * grads[2]
        # b2 = b2 - lr * grads[3]
        # w3 = w3 - lr * grads[4]
        # b3 = b3 - lr * grads[5]

        lr = 1e-3    #0.001
        w1.assign_sub(lr * grads[0])
        b1.assign_sub(lr * grads[1])
        w2.assign_sub(lr * grads[2])
        b2.assign_sub(lr * grads[3])
        w3.assign_sub(lr * grads[4])
        b3.assign_sub(lr * grads[5])

        # print(isinstance(b3, tf.Variable))
        # print(isinstance(b3, tf.Tensor))

        if step%100==0:      #每进行100个batch输出一次
            print(epoch,step,loss,float(loss))

#本次学习也算是继续理解线性回归模型，mnist图像识别的学习，收获还是很不错的，不过还有一些知识希望在之后的学习中进行计算理解。还挺开心的学这个东西，挺有意思的哈哈。

关于入门深度学习mnist数据集前向计算的记录的更多相关文章

(转)零基础入门深度学习(6) - 长短时记忆网络(LSTM)
无论即将到来的是大数据时代还是人工智能时代,亦或是传统行业使用人工智能在云上处理大数据的时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的技术,会不会感觉马上就o ...
问题集录--新手入门深度学习，选择TensorFlow 好吗？
新手入门深度学习,选择 TensorFlow 有哪些益处? 佟达:首先,对于新手来说,TensorFlow的环境配置包装得真心非常好.相较之下,安装Caffe要痛苦的多,如果还要再CUDA环境下配合O ...
[源码解析] 深度学习流水线并行 PipeDream(2)--- 计算分区
[源码解析] 深度学习流水线并行 PipeDream(2)--- 计算分区目录 [源码解析] 深度学习流水线并行 PipeDream(2)--- 计算分区 0x00 摘要 0x01 前言 1.1 P ...
深度学习常用数据集 API（包括 Fashion MNIST）
基准数据集深度学习中经常会使用一些基准数据集进行一些测试.其中 MNIST, Cifar 10, cifar100, Fashion-MNIST 数据集常常被人们拿来当作练手的数据集.为了方便,诸如 ...
Recorder︱深度学习小数据集表现、优化（Active Learning）、标注集网络获取
一.深度学习在小数据集的表现深度学习在小数据集情况下获得好效果,可以从两个角度去解决: 1.降低偏差,图像平移等操作 2.降低方差,dropout.随机梯度下降先来看看深度学习在小数据集上表现的具 ...
Python3读取深度学习CIFAR-10数据集出现的若干问题解决
今天在看网上的视频学习深度学习的时候,用到了CIFAR-10数据集.当我兴高采烈的运行代码时,却发现了一些错误: # -*- coding: utf-8 -*- import pickle as p ...
深度学习-mnist手写体识别
mnist手写体识别 Mnist数据集可以从官网下载,网址: http://yann.lecun.com/exdb/mnist/ 下载下来的数据集被分成两部分:55000行的训练数据集(mnist.t ...
零基础入门深度学习(6) - 长短时记忆网络(LSTM)
代码: def forward(self, x): ''' 根据式1-式6进行前向计算 ''' self.times += 1 # 遗忘门 fg = self.calc_gate(x, self.Wf ...
mxnet实战系列（一）入门与跑mnist数据集
最近在摸mxnet和tensorflow.两个我都搭起来了.tensorflow跑了不少代码,总的来说用得比较顺畅,文档很丰富,api熟悉熟悉写代码没什么问题. 今天把两个平台做了一下对比.同是跑mn ...

随机推荐

from表单、css选择器、css组合器、字体样式、背景属性、边框设置、display设置
目录一.form表单 1.form表单功能 2.表单使用原理二.前端基础之css 1.关于css的介绍 2.css语法 3.三种编写CSS的方式 3.1.style内部直接编写css代码 3.2. ...
46th ECfinal 游记
Day0 坐高铁坐了七小时从北戴河到西安,但第一次线下赛,来的路上还是很激动的路上看到华山,下次来西安一定去爬刚下高铁站遇到了一个不知道干啥的xjj xjj:可以占用您一点时间吗?谢谢了. 我:不 ...
LibreCAD常用命令
目录常见命令常见命令 .text_center { text-align: center } \3cp>.text_left { } 动作命令命令绘制直线相对坐标系 @长度<角度 ...
二进制redis集群部署
二进制redis集群部署〇.前言无聊想学罢了准备环境: 三台centos7 1C1GB即可三个路相连的地址主机 IP 节点-角色-实例(端口) redis1 172.16.106.128 M ...
OpenFOAM 编程 | One-Dimensional Transient Heat Conduction
0. 写在前面本文中将对一维瞬态热传导问题进行数值求解,并基于OpenFOAM类库编写求解器.该问题参考自教科书\(^{[1]}\)示例 8.1. 1. 问题描述一维瞬态热传导问题控制方程如下 \ ...
day36-IO流03
JavaIO流03 4.常用的类02 4.4节点流和处理流 4.4.1基本介绍节点流可以从一个特定的数据源读写数据,如FileReader.FileWriter 数据源就是存放数据的地方,比如文件. ...
Elasticsearch启动https访问
Elasticsearch上操作前提:已设置密码访问 ./bin/elasticsearch-certutil ca # 生成elastic-stack-ca.p12文件 ./bin/elastic ...
安装jumpserver 2.1.2版本遇到的坑
官方文档地址:https://docs.jumpserver.org/zh/master/install/step_by_step/ Jumpserver 对外需要开放 80 和 2222 端口,如果 ...
项目的依赖包（node_modules）删除
快速删除依赖包一共分为三部 1.打开命令行(管理员身份),执行 npm i -g npkill 2.cd 进入到想删除的项目中,执行 npkill 3.执行完成会进入到npkill页面,等待搜索完成, ...
（三）JPA - EntityManager的使用
(二)JPA 连接工厂.主键生成策略.DDL自动更新建议在需要使用时,看看之前的文章,先把环境搭起来. 4.EntityManager EntityManager 是完成持久化操作的核心对象. En ...

关于入门深度学习mnist数据集前向计算的记录

关于入门深度学习mnist数据集前向计算的记录的更多相关文章

随机推荐

热门专题