tensorFlow入门实践（三）初识AlexNet实现结构

参考黄文坚《TensorFlow实战》一书，完成AlexNet的整体实现并展望其训练和预测过程。

import tensorflow as tf

batch_size = 32

num_batches = 100

# 显示网络每一层结构，展示每一个卷积层或池化层输出tensor的尺寸,接受一个tensor作为输入

def print_activations(t):

    print(t.op.name, ' ', t.get_shape().as_list())

# 接受images作为输入，返回最后一层pool5（第五个池化层）

# 及parameters(AlexNet中所有需要训练的模型参数)'''

def inference(images):

    parameters = []

    with tf.name_scope('conv1') as scope:

        # 用截断的正态分布函数（标准差为0.1）初始化卷积核的参数kernel。卷积核尺寸为11*11，颜色通道为3，卷积核数量为64

        kernel = tf.Variable(tf.truncated_normal([11, 11, 3, 64],

                    dtype=tf.float32, stddev=1e-1), name='weights')

        # 使用tf.nn.conv2d对输入images完成卷积操作

        conv = tf.nn.conv2d(images, kernel, [1, 4, 4, 1], padding='SAME')

        biases = tf.Variable(tf.constant(0.0, shape=[64], dtype=tf.float32),

                             trainable=True, name='biases')

        bias = tf.nn.bias_add(conv, biases)

        conv1 = tf.nn.relu(bias, name=scope)

        print_activations(conv1)

        parameters += [kernel, biases]

    # LRN处理和最大池化处理

    lrn1 = tf.nn.lrn(conv1, 4, bias=1.0, alpha=0.001/9, beta=0.75, name='lrn1')

    pool1 = tf.nn.max_pool(lrn1, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],

                           padding='VALID', name='pool1')

    print_activations(pool1) # 打印输出结果pool1的结构

    # 设计第二个卷积层 卷积核尺寸5*5 输入通道数64 卷积核数量192

    with tf.name_scope('conv2') as scope:

        kernel = tf.Variable(tf.truncated_normal([5, 5, 64, 192],

                                                 dthpe=tf.float32, stddev=1e-1), name='weights')

        # 卷积步长全部设为1,即扫描全图像素

        conv = tf.nn.conv2d(pool1, kernel, [1, 1, 1, 1], padding='SAME')

        biases = tf.Variable(tf.constant(0.0, shape=[192], dtype=tf.float32),

                             trainable=True, name='biases')

        bias = tf.nn.bias_add(conv, biases)

        conv2 = tf.nn.relu(bias, name=scope)

        parameters += [kernel, biases]

        print_activations(conv2)

    lrn2 = tf.nn.lrn(conv2, 4, bias=1.0, alpha=0.001/9, beta=0.75, name='lrn2')

    pool2 = tf.nn.max_pool(lrn2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],

                           padding='VALID', name='pool2')

    print_activations(pool2)

    # 创建第三个卷积层 卷积核尺寸3*3 输入通道数192 卷积核数量384 步长全为1

    with tf.name_scope('conv3') as scope:

        kernel = tf.Variable(tf.truncated_normal([3, 3, 192, 384],

                                                 dthpe=tf.float32, stddev=1e-1), name='weights')

        # 卷积步长全部设为1,即扫描全图像素

        conv = tf.nn.conv2d(pool2, kernel, [1, 1, 1, 1], padding='SAME')

        biases = tf.Variable(tf.constant(0.0, shape=[384], dtype=tf.float32),

                             trainable=True, name='biases')

        bias = tf.nn.bias_add(conv, biases)

        conv3 = tf.nn.relu(bias, name=scope)

        parameters += [kernel, biases]

        print_activations(conv3)

    # 创建第四个卷积层 卷积核尺寸3*3 输入通道数384 卷积核数量降为256

    with tf.name_scope('conv4') as scope:

        kernel = tf.Variable(tf.truncated_normal([3, 3, 384, 256],

                                                 dthpe=tf.float32, stddev=1e-1), name='weights')

        # 卷积步长全部设为1,即扫描全图像素

        conv = tf.nn.conv2d(conv3, kernel, [1, 1, 1, 1], padding='SAME')

        biases = tf.Variable(tf.constant(0.0, shape=[256], dtype=tf.float32),

                             trainable=True, name='biases')

        bias = tf.nn.bias_add(conv, biases)

        conv4 = tf.nn.relu(bias, name=scope)

        parameters += [kernel, biases]

        print_activations(conv4)

        # 最后的第五个卷积层 卷积核尺寸3*3 输入通道数256 卷积核数量为256

        with tf.name_scope('conv5') as scope:

            kernel = tf.Variable(tf.truncated_normal([3, 3, 256, 256],

                                                     dthpe=tf.float32, stddev=1e-1), name='weights')

            # 卷积步长全部设为1,即扫描全图像素

            conv = tf.nn.conv2d(conv4, kernel, [1, 1, 1, 1], padding='SAME')

            biases = tf.Variable(tf.constant(0.0, shape=[256], dtype=tf.float32),

                                 trainable=True, name='biases')

            bias = tf.nn.bias_add(conv, biases)

            conv5 = tf.nn.relu(bias, name=scope)

            parameters += [kernel, biases]

            print_activations(conv5)

        # 在5个卷积层之后，还有一个最大池化层，这个池化层和前两个卷积层后的池化层一致

        pool5 = tf.nn.max_pool(conv5, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],

                               padding='VALID', name='pool5')

        print_activations(pool5)

        return pool5, parameters

        # 在正式使用AlexNet来训练或预测时，还需要添加3个全连接层，隐含节点数分别为4096、4096、1000

后续形成实现卷积神经网络构建、训练、测试的代码架构，会将Alexnet实现结构重新组织完整和优化。

tensorFlow入门实践（三）初识AlexNet实现结构的更多相关文章

c++开发ocx入门实践三--基于opencv的简易视频播发器ocx
原文:http://blog.csdn.net/yhhyhhyhhyhh/article/details/51404649 利用opencv做了个简易的视频播放器的ocx,可以在c++/c#/web ...
tensorFlow入门实践（三）实现lenet5（代码结构优化）
这两周我学习了北京大学曹建老师的TensorFlow笔记课程,认为老师讲的很不错的,很适合于想要在短期内上手完成一个相关项目的同学,课程在b站和MOOC平台都可以找到. 在卷积神经网络一节,课程以le ...
OpenCL入门：(三：GPU内存结构和性能优化)
如果我们需要优化kernel程序,我们必须知道一些GPU的底层知识,本文简单介绍一下GPU内存相关和线程调度知识,并且用一个小示例演示如何简单根据内存结构优化. 一.GPU总线寻址和合并内存访问假设 ...
tensorflow入门（三）
三种代价函数 1,二次代价函数式子代表预测值与样本值的差得平方和由于使用的是梯度下降法,我们对变量w,b分别求偏导: 这种函数对于处理线性的关系比较好,但是如果遇到s型函数(如下图所示),效率 ...
Docker入门实践(三) 基本操作
Docker安装完毕.我们就能够试着来执行一些命令了.看看docker能够干什么. (一) 创建一个容器首先.让我们执行一个最简单的容器,hello-world.假设安装没有问题.并执行正确的话,应 ...
tensorFlow入门实践（二）模块化
实现过一个例子之后,对TensorFlow运行机制有了初步的了解,但脑海中还没有一个如何实现神经网络的一个架构模型.下面我们来探讨如何模块化搭建神经网络,完成数据训练和预测. 首先我们将整体架构分为两 ...
tensorFlow入门实践（一）
首先应用TensorFlow完成一个线性回归,了解TensorFlow的数据类型和运行机制. import tensorflow as tf import numpy as np import mat ...
TensorFlow入门（三）多层 CNNs 实现 mnist分类
欢迎转载,但请务必注明原文出处及作者信息. 深入MNIST refer: http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mni ...
TensorFlow入门（五）多层 LSTM 通俗易懂版
欢迎转载,但请务必注明原文出处及作者信息. @author: huangyongye @creat_date: 2017-03-09 前言: 根据我本人学习 TensorFlow 实现 LSTM 的经 ...

随机推荐

Mac 下eclipse安装Lombok插件
在官网下载最新版本的 JAR 包. 将 lombok.jar 放在eclipse安装目录下,和 eclipse.ini 文件平级的. 注意,mac操作系统下eclipse的安装路径下有两个eclips ...
tomcat: 类加载器
一.tomcat是个web容器,要解决以下问题 1. 一个web容器可能要部署两个或者多个应用程序,不同的应用程序,可能会依赖同一个第三方类库的不同版本,因此要保证每一个应用程序的类库都是独立.相互隔 ...
python-获取URL中的json数据
数据源为某系统提供的URL,打开是json文件,python代码获取如下: URL替换成自己的即可. import urllib.request def get_record(url): resp = ...
jmeter csv 参数化
from:https://blog.csdn.net/bafasanqianzhang/article/details/77480297 [注意:csv可以上传txt,csv,另外参数必须正确否则会报 ...
解决:SSM框架中普通类调用Service的问题（转）
http://blog.csdn.net/gwd1154978352/article/details/73480959
fetch与XHR的区别与优势
Fetch API更加现代 XHR 和 Fetch API 最显著的区别就是调用方式不同.这一点大家应该都知道吧. 举个例子,下面两端代码完成的是同一功能: // 用 XHR 发起一个GET请求 va ...
从ranknet到lamdarank，再到lamdamart
learn2rank目前基本两个分支,1是神经网络学派ranknet,lamdarank,另一个是决策树学派如gbrank,lamdamart 05年提出ranknet,算分模块是简单的全连接网络,l ...
The innodb_system data file 'ibdata1' must be writable
在安装MySQL的时候报的错,我理解的这个错是因为有个文件是Innodb需要在安装MySQL(或者创建数据库的时候)的时候需要写入这个文件,但是他现在没有写的权限. 日志中的错误是: 5.7版本以前是 ...
HTTPS、SSL 原理
1.1 背景知识对称加密 :加密解密使用同一密钥,加解密速度快.随着人数增多,密钥数量急增n(n-1)/2. 非对称加密 :使用公私钥配对加解密,速度慢.公钥是从私钥中提取出来的,一般拿对方 ...
依赖注入框架Ninject
为什么需要依赖注入我们提到MVC的一个重要特征是关注点分离(separation of concerns).我们希望应用程序的各部分组件尽可能多的相互独立.尽可能少的相互依赖. 我们的理想情况是:一 ...

tensorFlow入门实践（三）初识AlexNet实现结构

tensorFlow入门实践（三）初识AlexNet实现结构的更多相关文章

随机推荐

热门专题