假期续命充电——简单上手tesorflow2 框架
谈到深度学习,就不得不谈到tensorflow
在tensorflow之后出了2.0版本,相比之前有了很大的改变,趁着假期赶紧冲冲冲!
稍微学习了一些基础,做一个自我总结,作为一些基础的知识不再过多重复,有需要的自己上网查询。
写了一些代码,尽可能给出了必要的注释,具体的数学知识或者环境、运行问题欢迎留言讨论
使用语言为python 3.x
1.梯度下降
# 深度学习中不用担心局部极值点
# model.compile(optimizer='adam', loss='mse')中 optimizaer = 'adam'就是用了这样的优化方式
2.线性回归
import tensorflow as tf
import pandas as pd
import matplotlib.pyplot as plt data = pd.read_csv("education_income.csv")
print("****\n", data)
x = data.Education
y = data.Income
# 可视化数据
plt.title('la')
plt.xlabel("xxx")
plt.ylabel("yyy")
plt.plot(x, y, "ob")
plt.show()
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(1, input_shape=(1,))) # dense里面(输出数据的维度,输入数据的形状,注意要有1,)
model.summary() #反应这个模型的基本情况,上面这个模型就是将(1,)的数据最后输出为一维数据,即y=ax+b
# 配置模型
model.compile(optimizer='adam', loss='mse') #优化方法,损失函数
# 编译模型
history = model.fit(x, y, epochs=5000)
# 使用模型预测现有的值
model.predict(x)
# 预测未知的值,输入series是所以里面写成这样
model.predict(pd.Series([20]))
3.多层感知器
import tensorflow as tf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt data = pd.read_csv('xxxxxx.csv')
x = data.iloc[:, 1:-1] # 除去第一列和最后一列
y = data.iloc[:, -1] # 取到最后一列
# 建立模型
model = tf.keras.Sequential([tf.keras.layers.Dense(10, input_shape=(3,),activation='relu')], )
# dense就是隐含层,这里设置了10,inputshape是输入的数据的规格,activation是激活函数
# 配置模型
model.compile(optimizer='adam', loss='mse') #优化方法,损失函数
model.fit(x,y,epochs=100) # 编译模型 # 使用模型预测现有的值
model.predict(x)
# 预测未知的值,输入series是所以里面写成这样
model.predict(pd.Series([20])) test = data.iloc[:10,1:-1] #设置一个test,取他的前十个
model.predict(test) #这个是对应的预测值
test = data.iloc[:10, -1] #这个是实际的test值
4.逻辑回归
'''
平方差所惩罚的是与损失同一数量级的情形
二对于分类问题,最好使用交叉熵损失函数(输出更大)
tf.keras 中我们用到的是binary_crossentropy
''' import tensorflow as tf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt data = pd.read_csv('xxxx.csv') #一共16列前十五列是数据,这里的数据最后一列是1和-1的结果值
data.iloc[:,-1].value_counts() #查看最后一列的数据分布情况 x = data.iloc[:,:-1]
y = data.iloc[:,-1].replace(-1,0) # 把最后一列的数据中的-1替换成0 model = tf.keras.Sequential()# 顺序模型
model.add(tf.keras.layers.Dense(4,input_shape(15,),activation='relu'))
model.add(tf.keras.layers.Dense(4,activation='relu')) #再加上一层隐含层,不必再去输入shape的格式他会自己去推断
model.add(tf.keras.layers.Dense(1,activation='sigmoid')) #定义了输出层的结构,输出的维度为一 model.summary() # 编译模型
model.compile(optimizer='adam',loss='binary_crossentropy',metrics='acc')
# 这里每次进行云散时,损失函数是交叉熵,每一次计算的时候求acc(accurary准确率) #训练
history = model.fit(x,y,epochs=100) history.history.keys()# 现实的是记录的模型数据,这里是lss和acc的值
plt.plot(history.epoch, history.get('loss'))
plt.plot(history.epoch, history.get('acc'))
5.softmax分类
'''
平方差所惩罚的是与损失同一数量级的情形
二对于分类问题,最好使用交叉熵损失函数(输出更大)
tf.keras 中我们用到的是binary_crossentropy
''' import tensorflow as tf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt data = pd.read_csv('xxxx.csv') #一共16列前十五列是数据,这里的数据最后一列是1和-1的结果值
data.iloc[:,-1].value_counts() #查看最后一列的数据分布情况 x = data.iloc[:,:-1]
y = data.iloc[:,-1].replace(-1,0) # 把最后一列的数据中的-1替换成0 model = tf.keras.Sequential()# 顺序模型
model.add(tf.keras.layers.Dense(4,input_shape(15,),activation='relu'))
model.add(tf.keras.layers.Dense(4,activation='relu')) #再加上一层隐含层,不必再去输入shape的格式他会自己去推断
model.add(tf.keras.layers.Dense(1,activation='sigmoid')) #定义了输出层的结构,输出的维度为一 model.summary() # 编译模型
model.compile(optimizer='adam',loss='binary_crossentropy',metrics='acc')
# 这里每次进行云散时,损失函数是交叉熵,每一次计算的时候求acc(accurary准确率) #训练
history = model.fit(x,y,epochs=100) history.history.keys()# 现实的是记录的模型数据,这里是lss和acc的值
plt.plot(history.epoch, history.get('loss'))
plt.plot(history.epoch, history.get('acc'))
6.优化函数、学习速率、反向传播
'''
梯度下降输出响亮是损失函数增长最快的方向
梯度就是表明损失函数相对参数的变化率 对提督缩放的参数称为学习速率,超参数或者手工呢配置,太小会需要很多迭代,太大会跳过极值点(永远到不了)
调整学习速率,要足够小不超调,又要足够大尽快完成学习 多层时,反向传播返回
逐一计算隐含层的输出,计算导数,对已经完成计算的元素进行复用 optimizer ->传人model.compile中,也可以直接再后者中命令
常见的优化函数:
SGD:随即梯度下降优化器
RNSprop: 常用语 序列化的函数,序列预测,rnn lr学习速率rho提督平方的移动平均衰减率epsilon模糊因子decay参数跟新后学习速率衰减值
Adam :学习率建议0。001
''' model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate = 0.001))
7.网络优化和超参数选择
'''
增加神经元或者层数(徐年速度难度大,易过拟合) ''' history = model.fit(train_image,train_label_onehot,epochs=5,validation_data =(test_image,test_label_onehot)) #后面那个的作用就是再test中验证每一次循环中的准确率 '''
dropout避免过拟合
参数选择原则:先开发一个过拟合(添加跟多层,每一层跟大,训练更多轮次))
再抑制过拟合(dropout,正则化、图像增强),最好的办法还是增加训练样本
调节超惨数(学习速率、隐藏单元数、训练轮次) 传统机器学习有特征工程、增加训练数据、交叉验证等等 总的原则:1增大网络容量直到过拟合 2采取措施抑制过拟合 3重复第一个步骤
'''
model = tf.keras.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(28,28))) # flatten的作用就是将而为的数据降到以为当中来
model.add(tf.keras.layers.Dense(128,activation='relu'))
model.add(tf.keras.layers.Dropout(0.5)) #这里就是每一次丢弃50%随机丢弃
model.add(tf.keras.layers.Dense(128,activation='relu'))
model.add(tf.keras.layers.Dropout(0.5))
model.add(tf.keras.layers.Dense(128,activation='relu'))
model.add(tf.keras.layers.Dropout(0.5))
model.add(tf.keras.layers.Dense(10,activation='softmax')) # 也可以减少网络规模(单元层),128变成32隐藏单元数
model.add(tf.keras.layers.Dense(32,activation='relu'))
8.函数式API
import tensorflow as tf
import tensorflow as keras
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt # fashion_mnist数据集可以直接用tensorflow加载,label用数字代表服装的类别
(train_image,train_label),(test_image,test_label) = tf.keras.datasets.fashion_mnist.load_data # 归一化
train_image = train_image/255
test_image = test_image/255 # 函数层API 建模
#train_images.shape
input = keras.Input(shape=(28,28))
x = keras.layers.Flatten()(input)
x = keras.layers.Dense(32,activation = 'relu')(x) # 在x上面增加一层
x = keras.layers.Dropout(0.5)
x = keras.layers.Dense(64,activation = 'relu')(x)
output = keras.layers.Dense(10,activation = 'softmax')(x) model = keras.Model(input,outputs = output)
# model.summary # 可以进行多输入 input1 input2
input1 = keras.Input(shape=(28,28))
input2 = keras.Input(shape=(28,28))
x1 = keras.layers.Flatten()(input1)
x2 = keras.layers.Flatten()(input2)
x = keras.layers.concatenate([x1,x2])
x = keras.layers.Dense(32,activation = 'relu')(x) # 在x上面增加一层
x = keras.layers.Dropout(0.5)
x = keras.layers.Dense(64,activation = 'relu')(x)
output = keras.layers.Dense(10,activation = 'sigmold')(x) # 逻辑回归的问题用sigmold model = keras.Model([input1,input2],outputs = output)
看到这里,一般对于基本的tensorflow2的用法有了一定的基础,剩下的我也还在学习
这里给一些参考网址
https://tensorflow.google.cn/tutorials/structured_data/time_series
https://www.jianshu.com/p/599c79c3a537
假期续命充电——简单上手tesorflow2 框架的更多相关文章
- Tinker 热修复框架 简单上手教程
当你们看到Tinker的时候是不是有点愣逼这个是什么东西? 简单来说就是不需要重新下载app和重新安装app 来进行更新app的技术框架. 看看这个吧,我也是才学习 ,先做个学习记录 参考:Tinke ...
- 用Python写一个简单的Web框架
一.概述 二.从demo_app开始 三.WSGI中的application 四.区分URL 五.重构 1.正则匹配URL 2.DRY 3.抽象出框架 六.参考 一.概述 在Python中,WSGI( ...
- PHP之简单实现MVC框架
PHP之简单实现MVC框架 1.概述 MVC全名是Model View Controller,是模型(model)-视图(view)-控制器(controller)的缩写,一种软件设计典范,用一种 ...
- iOS开发网络篇—简单介绍ASI框架的使用
iOS开发网络篇—简单介绍ASI框架的使用 说明:本文主要介绍网络编程中常用框架ASI的简单使用. 一.ASI简单介绍 ASI:全称是ASIHTTPRequest,外号“HTTP终结者”,功能十分强大 ...
- Maven+Spring+Hibernate+Shiro+Mysql简单的demo框架(二)
然后是项目下的文件:完整的项目请看 上一篇 Maven+Spring+Hibernate+Shiro+Mysql简单的demo框架(一) 项目下的springmvc-servlet.xml配置文件: ...
- AsMVC:一个简单的MVC框架的Java实现
当初看了<从零开始写一个Java Web框架>,也跟着写了一遍,但当时学艺不精,真正进脑子里的并不是很多,作者将依赖注入框架和MVC框架写在一起也给我造成了不小的困扰.最近刚好看了一遍sp ...
- 一个简单的web框架实现
一个简单的web框架实现 #!/usr/bin/env python # -- coding: utf-8 -- __author__ = 'EchoRep' from wsgiref.simple_ ...
- 最简单的Java框架
框架framework的目的是定义骨架式方案,处理各种相同的底层细节:而开发人员使用框架时,能够依照自己的需求实现自己的功能--仅仅须要填入自己的东西/flesh. 最简单的框架,类似于JUnit,它 ...
- [angularjs] MVC + Web API + AngularJs 搭建简单的 CURD 框架
MVC + Web API + AngularJs 搭建简单的 CURD 框架 GitHub 地址:https://github.com/liqingwen2015/Wen.MvcSinglePage ...
随机推荐
- P1070 东风谷早苗
题目描述 在幻想乡,东风谷早苗是以高达控闻名的高中生宅巫女.某一天,早苗终于入手了最新款的钢达姆模型.作为最新的钢达姆,当然有了与以往不同的功能了,那就是它能够自动行走,厉害吧(好吧,我自重).早苗的 ...
- java笔试题及其答案
1:下列哪个工具可以编译源文件(A) A:javac B:jdb C:javadoc D:junit 2:String b = new String("1"+"2&quo ...
- windows环境下pgsql的安装与使用
- idea启用列模式的方式小结
(1)alt+鼠标左键----实现的是几个连续列要向上或者向下拉,能够同时操作多行数据. (2)Shift+alt+鼠标左键----可以实现点选跨行的列模式同时操作,而且不通行可以点选不通列,进行跨行 ...
- C# 程序集数量对软件启动性能的影响
本文通过很多的数据测试分析在一个项目引用很多个外部项目和将外部项目的类合并到一个项目之间的启动性能的不同. 通过分析知道了如果一个项目引用了很多项目,而且在启动过程会全部调用这些项目,这时的软件性能会 ...
- 深浅Copy的理解
在python里对对象进行拷贝有三个,即赋值,深拷贝,浅拷贝. 而对象又分为两种,一种是不可变对象(字符串.元组.数字 ),一种是可变对象(列表.字典). 而深浅拷贝有三种情况:拷贝的是不可变对象.拷 ...
- Hamcrest Tutorial
Java Hamcrest Home Hamcrest Tutorial Introduction Hamcrest is a framework for writing matcher object ...
- JNI相关使用记录
JNI 工作流程 java层调用system.load方法. 通过classloader拿到了so文件的绝对路径,然后调用nativeload()方法. 通过linux下的dlopen方法,加载并查找 ...
- asp.net core 3.0 JObject The collection type 'Newtonsoft.Json.Linq.JObject' is not supported
在asp.net core 3.0 中,如果直接在Controller中返回 Jobject 类型,会抛出如下错误: The collection type 'Newtonsoft.Json.Linq ...
- UVA live 6667 三维严格LIS
UVA live 6667 三维严格LIS 传送门:https://vjudge.net/problem/UVALive-6667 题意: 每个球都有三个属性值x,y,z,要求最长的严格lis的长度和 ...