【笔记】机器学习 - 李宏毅 - 9

3.1 configuration

3.2 寻找最优网络参数

代码示例：

# 1.Step 1

model = Sequential()

model.add(Dense(input_dim=28*28, output_dim=500)) # Dense是全连接

model.add(Activation('sigmoid'))

model.add(Dense(output_dim=500))

model.add(Activation('sigmoid'))

model.add(Dense(output_dim=10))

model.add(Activation('softmax'))

# Step 2

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# Step 3

model.fit(x_train, y_train, batch_size=100, nb_epoch=20)

# 模型保存

#case1：测试集正确率

score = model.evaluate(x_test,y_test)

print("Total loss on Testing Set:", score[0])

print("Accuracy of Testing Set:", score[1])

#case2：模型预测

result = model.predict(x_test)

Keras 2.0 代码类似

# 创建网络

model=Sequential()

model.add(Dense(input_dim=28*28,units=500,activation='relu'))

model.add(Dense(units=500,activation='relu'))

model.add(Dense(units=10,activation='softmax'))

# 配置

model.compile(loss='categorical crossentropy',optimizer='adam',metrics=['accuracy'])

# 选择最好的方程

model.fit(x_train,y_train,batch_size=100,epochs=20)

# 使用模型

score = model.evaluate(x_test,y_test)

print('Total loss on Testiong Set : ',score[0])

print('Accuracy of Testiong Set : ',score[1])

# 上线后预测

result = model.predict(x_test)

x_train, y_train解释

小批量梯度下降，速度更快的原因是因为可以并行计算。

完整的Keras演示：

import numpy as np

from keras.models import Sequential

from keras.layers.core import Dense,Dropout,Activation

from keras.optimizers import SGD,Adam

from keras.utils import np_utils

from keras.datasets import mnist

def load_data():

    (x_train,y_train),(x_test,y_test)=mnist.load_data()

    number=10000

    x_train=x_train[0:number]

    y_train=y_train[0:number]

    x_train=x_train.reshape(number,28*28)

    x_test=x_test.reshape(x_test.shape[0],28*28)

    x_train=x_train.astype('float32')

    x_test=x_test.astype('float32')

    y_train=np_utils.to_categorical(y_train,10)

    y_test=np_utils.to_categorical(y_test,10)

    x_train=x_train

    x_test=x_test

    x_train=x_train/255

    x_test=x_test/255

    return (x_train,y_train),(x_test,y_test)

(x_train,y_train),(x_test,y_test)=load_data()

model=Sequential()

model.add(Dense(input_dim=28*28,units=633,activation='sigmoid'))

model.add(Dense(units=633,activation='sigmoid'))

model.add(Dense(units=633,activation='sigmoid'))

model.add(Dense(units=10,activation='softmax'))

model.compile(loss='mse',optimizer=SGD(lr=0.1),metrics=['accuracy'])

model.fit(x_train,y_train,batch_size=100,epochs=20)

result= model.evaluate(x_test,y_test)

print('TEST ACC:',result[1])

运行结果：

Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz

11493376/11490434 [==============================] - 21s 2us/step

Epoch 1/20

10000/10000 [==============================] - 3s 342us/step - loss: 0.0905 - acc: 0.1042

Epoch 2/20

10000/10000 [==============================] - 3s 292us/step - loss: 0.0900 - acc: 0.1043

Epoch 3/20

10000/10000 [==============================] - 3s 278us/step - loss: 0.0900 - acc: 0.1096

Epoch 4/20

10000/10000 [==============================] - 3s 284us/step - loss: 0.0900 - acc: 0.1133

Epoch 5/20

10000/10000 [==============================] - 3s 290us/step - loss: 0.0900 - acc: 0.1105

Epoch 6/20

10000/10000 [==============================] - 3s 286us/step - loss: 0.0900 - acc: 0.1120

Epoch 7/20

10000/10000 [==============================] - 3s 316us/step - loss: 0.0900 - acc: 0.1098

Epoch 8/20

10000/10000 [==============================] - 3s 306us/step - loss: 0.0900 - acc: 0.1117

Epoch 9/20

10000/10000 [==============================] - 3s 294us/step - loss: 0.0900 - acc: 0.1102

Epoch 10/20

10000/10000 [==============================] - 3s 296us/step - loss: 0.0899 - acc: 0.1129

Epoch 11/20

10000/10000 [==============================] - 3s 334us/step - loss: 0.0899 - acc: 0.1153

Epoch 12/20

10000/10000 [==============================] - 3s 307us/step - loss: 0.0899 - acc: 0.1141

Epoch 13/20

10000/10000 [==============================] - 4s 351us/step - loss: 0.0899 - acc: 0.1137 0s - loss: 0.089

Epoch 14/20

10000/10000 [==============================] - 3s 321us/step - loss: 0.0899 - acc: 0.1157

Epoch 15/20

10000/10000 [==============================] - 3s 302us/step - loss: 0.0899 - acc: 0.1156

Epoch 16/20

10000/10000 [==============================] - 3s 323us/step - loss: 0.0899 - acc: 0.1159 1s -

Epoch 17/20

10000/10000 [==============================] - 3s 331us/step - loss: 0.0899 - acc: 0.1141

Epoch 18/20

10000/10000 [==============================] - 3s 299us/step - loss: 0.0899 - acc: 0.1234

Epoch 19/20

10000/10000 [==============================] - 3s 316us/step - loss: 0.0899 - acc: 0.1143

Epoch 20/20

10000/10000 [==============================] - 3s 337us/step - loss: 0.0899 - acc: 0.1236

10000/10000 [==============================] - 2s 246us/step

TEST ACC: 0.1028

可以调一下units的参数值，可以再多加几层，尝试一下效果并不是很好，之后章节会对这个代码进行优化。

【笔记】机器学习 - 李宏毅 - 9 - Keras Demo的更多相关文章

【笔记】机器学习 - 李宏毅 - 11 - Keras Demo2 & Fizz Buzz
1. Keras Demo2 前节的Keras Demo代码: import numpy as np from keras.models import Sequential from keras.la ...
【笔记】机器学习 - 李宏毅 - 2 - Regression + Demo
Regression 回归应用领域包括:Stock Market Forecast, Self-driving car, Recommondation,... Step 1: Model 对于宝可梦 ...
100天搞定机器学习|day40-42 Tensorflow Keras识别猫狗
100天搞定机器学习|1-38天 100天搞定机器学习|day39 Tensorflow Keras手写数字识别前文我们用keras的Sequential 模型实现mnist手写数字识别,准确率0. ...
Python机器学习笔记：深入理解Keras中序贯模型和函数模型
先从sklearn说起吧,如果学习了sklearn的话,那么学习Keras相对来说比较容易.为什么这样说呢? 我们首先比较一下sklearn的机器学习大致使用流程和Keras的大致使用流程: skl ...
Python机器学习笔记：深入学习Keras中Sequential模型及方法
Sequential 序贯模型序贯模型是函数式模型的简略版,为最简单的线性.从头到尾的结构顺序,不分叉,是多个网络层的线性堆叠. Keras实现了很多层,包括core核心层,Convolution卷 ...
机器学习笔记P1(李宏毅2019)
该博客将介绍机器学习课程by李宏毅的前两个章节:概述和回归. 视屏链接1-Introduction 视屏链接2-Regression 该课程将要介绍的内容如下所示: 从最左上角开始看: Regress ...
【笔记】机器学习 - 李宏毅 - 12 - CNN
Convolutional Neural Network CNN 卷积神经网络 1. 为什么要用CNN? CNN一般都是用来做图像识别的,当然其他的神经网络也可以做,也就是输入一张图的像素数组(pix ...
【笔记】机器学习 - 李宏毅 - 10 - Tips for Training DNN
神经网络的表现在Training Set上表现不好 ----> 可能陷入局部最优在Testing Set上表现不好 -----> Overfitting 过拟合虽然在机器学习中,很容 ...
【笔记】机器学习 - 李宏毅 - 5 - Classification
Classification: Probabilistic Generative Model 分类:概率生成模型如果说对于分类问题用回归的方法硬解,也就是说,将其连续化.比如 \(Class 1\) ...

随机推荐

3、IP地址划分
划分子网方法:1.你所选择的子网掩码将会产生多少个子网?:2 的x 次方(x 代表被借走的主机位数)2.每个子网能有多少主机?: 2 的y 次方-2(y 代表被借走之后剩余的主机位数)3.块大小:bl ...
Java数据类型及对应取值范围
Java数据类型及对应取值范围在Java中,数据类型分为两大种:基本数据类型(值类型)和包装类型(引用数据类型).基本数据类型不是对象,不能调用toString().hashCode().getCl ...
java上传组件commons-fileupload的一些使用方法
在 http://www.apache.org,下载commons-fileupload-1.2.1.jar包,并把这个包加到工程中,以下是记录这个上传组件的一些使用方法. html测试页面,实现上传 ...
利用Python进行TCP、UDP套接字编程
参考:http://www.cnblogs.com/whatbeg/p/5155524.html http://www.cnblogs.com/nzyjlr/p/4236287.html
Docker容器到底是什么?
Docker是一个开源的应用容器引擎,是近些年最火的技术之一,Docker公司从Docker项目开源之后发家致富把公司商标改为了Docker,收购了fit项目,整合为了docker-compose,前 ...
ORACLE-SQLLOAD导入外部数据详解
今天公司需要把外部文本的一些数据导入到数据库.这里把相关步骤和注意的地方记录,供需要的人参考学习!这里的环境是在windows下的数据库,linux或者其他数据库同理! 1.准备工作:创建需要导入数据 ...
【C++】C++程序链接失败，无法解析的外部命令，无法解析的外部符号 "private: static class * Object::current"
C++程序编译结束后,出现链接失败提示: 严重性代码说明项目文件行类别禁止显示状态错误 LNK2001 无法解析的外部符号 &quo ...
JAVA中的约瑟夫环和猴子王问题
今天在书上(书名< java程序设计经典300例 >李源编著)看了一个有趣的问题,那就是java版的约瑟夫问题,想必大一的小伙伴们早就用c写过了吧今天我在复习一下首先问题是这样的n个人 ...
python使用turtle库绘制奥运五环
效果图: #奥运五环 import turtle turtle.setup(1.0,1.0) #设置窗口大小 turtle.title("奥运五环") #蓝圆 turtle.pen ...
20191223-python学习第三天
1.运算符补充 (1)in 与 not in 学习 (2)优先级 >小于 ,<小于,计算运算关系优先级 > not > and > or 2.charm自动生成文件头部 ...

【笔记】机器学习 - 李宏毅 - 9 - Keras Demo

【笔记】机器学习 - 李宏毅 - 9 - Keras Demo的更多相关文章

随机推荐

热门专题