【PaddlePaddle系列】Executor逐步训练模型

前言

PaddlePaddle使用Trainer训练模型虽然直接了当，方便快捷，但是对于一些需要逐步训练的模型则比较麻烦。类似Tensorflow采用session.run的形式逐步训练模型，使得训练过程更加显而易见。PaddlePaddle新版本Fluid中，采用Executor也可以完成类似的训练。本文针对简单的回归问题简述以下PaddlePaddle的Executor训练过程。

1. Reader的建立

本文尝试使用神经网络模型拟合二次函数，首先我们建立以下二次函数的训练数据，并加上噪声：

train_x  = np.linspace(-1, 1, 128)       # shape (100, 1)

noise    = np.random.normal(0, 0.1, size=train_x.shape)

train_y  = np.power(train_x, 2) + noise

def reader():

    def reader_creator():

        for i in range(128):

            yield train_x[i],train_y[i]

    return reader_creator
train_reader = paddle.batch(reader(),batch_size=64)

2. 网络的构建以及损失函数

我们构建一层10个神经元的隐藏层，代码如下：

#构建网络模型

input_layer   = fluid.layers.data(name='data',shape=[1],dtype='float32')

hid   = fluid.layers.fc(input=input_layer, size=10, act='relu')

output = fluid.layers.fc(input=hid, size=1, act=None)

label  = fluid.layers.data(name='label',shape=[1],dtype='float32')

#损失函数采用均方差

cost   = fluid.layers.square_error_cost(input=output,label=label)

avg_cost = fluid.layers.mean(cost)

#优化器选择

optimizer = fluid.optimizer.AdamOptimizer(learning_rate=0.01)

opts      = optimizer.minimize(avg_cost)

3. 训练模型

训练同往常一样，但是需要新建一个Executor和DataFeeder，然后直接对每个batch进行训练，直接明了。

#选择CPU

place = fluid.CPUPlace()

feeder = fluid.DataFeeder(place=place, feed_list=['data', 'label'])

#克隆program用于后面测试

test_program = fluid.default_main_program().clone(for_test=True)

exe = fluid.Executor(place)

#初始化参数

exe.run(fluid.default_startup_program())

for pass_id in range(1000):

#遍历每个batch

    for batch_id,data in enumerate(train_reader()):

        loss = exe.run(fluid.default_main_program(),

                             feed=feeder.feed(data),

                             fetch_list=[avg_cost])

4. 测试

这里也是同样运用exe.run，与上面训练差不多一样。这里还是用回训练集测试，将每个batch的结果保存在数组中。

    #用于保存每个batch的结果，便签等

    x_ = []

    y_ = []

    l_= []

    for batch_id,data in enumerate(train_reader()):

        x,y,l=exe.run(program=test_program,

               feed=feeder.feed(data),

               fetch_list=[input_layer,output,label])

        x_ =np.hstack((x_,x.ravel()))

        y_ =np.hstack((y_,y.ravel()))

        l_ =np.hstack((l_,l.ravel()))

5.结果

红线逐步拟合到散点

参考：T ensorflow-Tutorial /tutorial-contents /301_simple_regression.py

代码：GitHub

【PaddlePaddle系列】Executor逐步训练模型的更多相关文章

【PaddlePaddle系列】报错解决方法合集（不定时更新）
1.PaddlePaddle使用CPU时正常运行,但是使用GPU时却报出一堆错误信息,节选如下: paddle.fluid.core.EnforceNotMet: enforce allocating ...
Java基础系列--Executor框架（一）
文章来源:http://www.cnblogs.com/V1haoge/p/8393618.html 一.Executor框架介绍 Executor框架是JDK1.5之后出现的,位于juc包中,是并发 ...
【PaddlePaddle系列】CIFAR-10图像分类
前言本文与前文对手写数字识别分类基本类似的,同样图像作为输入,类别作为输出.这里不同的是,不仅仅是使用简单的卷积神经网络加上全连接层的模型.卷积神经网络大火以来,发展出来许多经典的卷积神经网络模型, ...
【PaddlePaddle系列】手写数字识别
最近百度为了推广自家编写对深度学习框架PaddlePaddle不断推出各种比赛.百度声称PaddlePaddle是一个“易学.易用”的开源深度学习框架,然而网上的资料少之又少.虽然百度很用心地提供 ...
PaddlePaddle tutorial
什么是PaddlePaddle PaddlePaddle,百度旗下深度学习开源平台.Paddle(Parallel Distributed Deep Learning,并行分布式深度学习). 2016 ...
【翻译】OpenVINO Pre-Trained 预训练模型介绍
OpenVINO 系列软件包预训练模型介绍本文翻译自 Intel OpenVINO 的 "Overview of OpenVINO Toolkit Pre-Trained Models& ...
推荐一款Python神器，5 行 Python 代码实现一键批量扣图
今天给大家分享一款Python装逼实用神器. 在日常生活或者工作中,经常会遇到想将某张照片中的人物抠出来,然后拼接到其他图片上去.专业点的人可以使用 PhotoShop 的"魔棒" ...
华为高级研究员谢凌曦：下一代AI将走向何方？盘古大模型探路之旅
摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...
【深度学习系列】PaddlePaddle之手写数字识别
上周在搜索关于深度学习分布式运行方式的资料时,无意间搜到了paddlepaddle,发现这个框架的分布式训练方案做的还挺不错的,想跟大家分享一下.不过呢,这块内容太复杂了,所以就简单的介绍一下padd ...

随机推荐

揭开AutoRun功能的神秘面纱
有很多光盘放入光驱就会自动运行,它们是怎么做到的呢?光盘一放入光驱就会自动被执行,主要依靠两个文件,一是光盘上的AutoRun.inf文件,另一个是操作系统本身的系统文件之一的Cdvsd.vxd.Cd ...
201709012工作日记--Android消息机制
1. android的消息机制——Handler机制参考:http://www.jianshu.com/p/9e4d1fab0f36. Android异步消息处理机制完全解析,带你从源码的角度理解: ...
《SLAM for Dummies》中文版《SLAM初学者教程》
SLAM for Dummies SLAM初学者教程A Tutorial Approach to Simultaneous Localization and Mapping 一本关于实时定位及绘图 ...
11i AP & GL 月末对账时常用系统报表
11i AP & GL 月末对账时常用系统报表 http://www.cnblogs.com/benio/archive/2011/10/14/2212169.html AP: 1.Invo ...
一起学习MVC（3）Views的学习
_ViewStart.cshtml._Layout.cshtml.Index.cshtml三个页面加载时候的先后顺序就是: _Layout.cshtml ViewStart.cshtml ...
浏览器拦截跨域请求处理方法（同源策略不允许读取XXX上的远程资源）
直接了当了说,解决此类问题,最直接的方法就是,就是给被请求的服务器,添加HTTP头响应头,这里提供两种添加HTTP头的方法: 第一种,就是在程序中添加HTTP头: Response.AddHeader ...
避免图片路径访问405，可以用图片控件来显示局部相对路径，不需要域名就不会出现jpg静态资源访问错误
<asp:Image ID="Image1" runat="server"/> protected void Page_Load(object se ...
MVVM Light 新手入门（2）：ViewModel / Model 中定义“属性” ，并在View中调用
今天学习MVVM架构中“属性”的添加并调用,特记录如下,学习资料均来自于网络,特别感谢翁智华的利刃 MVVMLight系列. 一个窗口的基本模型如下: View(视图) -> ViewModel ...
使用node_redis进行redis数据库crud操作
正在学习使用pomelo开发游戏服务器,碰到node.js操作redis,记录一下假设应用场景是操作一个用户表的数据引入node_redis库,创建客户端 var redis = require( ...
LinkedBlockingQueue源码解析（2）
此文已由作者赵计刚授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. 3.3.public void put(E e) throws InterruptedException 原 ...