一、机器学习基本概念

1.训练集和测试集

训练集(training set/data)/训练样例（training examples): 用来进行训练，也就是产生模型或者算法的数据集

测试集(testing set/data)/测试样例 (testing examples)：用来专门进行测试已经学习好的模型或者算法的数据集

2.特征向量

特征向量(features/feature vector)：属性的集合，通常用一个向量来表示，附属于一个实例

3.分类问题和回归问题

分类 (classification): 目标标记为类别型（离散型）数据(category)

回归(regression): 目标标记为连续性数值 (continuous numeric value)

4.机器学习分类

有监督学习(supervised learning)：训练集有类别标记(class label)

无监督学习(unsupervised learning)：无类别标记(class label)

半监督学习（semi-supervised learning)：有类别标记的训练集 + 无标记的训练集

二、简单线性回归

基本概念：

简单线性回归包含一个自变量(x)和一个因变量(y)
被用来进行预测的变量叫做：自变量(independent variable), x, 输入(input)
被预测的变量叫做：因变量(dependent variable), y, 输出(output)
以上两个变量的关系用一条直线来模拟

三、Tensorflow基本概念

1.使用图(graphs)来表示计算任务
2.在被称之为会话（Session）的上下文（context）中执行图
3.使用tensor（张量）表示数据
4.通过变量（Variable）来维护状态
5.使用feed和fetch可以为任何的操作赋值或者从其中获取数据

总结

Tensorflow是一个编程系统，使用图（graphs）来表示计算任务，
图（graphs）中的节点称之为op（operation）
一个op获得0个或者多个tensor（张量），执行计算，产生0个或者多个tensor。
tensor看作是一个n维的数组或者列表。
图必须在会话（Session）里被启动。

#通过示意图来理解其中含义：

#通过程序来理解其中含义：

#这两句代码是防止警告（The TensorFlow library wasn't compiled to use AVX2 instructions, but these are available on your machine and could speed up CPU computations.）

import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

import tensorflow as tf

m1 = tf.constant([[3,3]])    #创建一个常量op

m2 = tf.constant([[2],[3]])   #创建一个常量op

product =tf.matmul(m1,m2)   #创建一个矩阵乘法op，并将m1和m2传入

sess = tf.Session()    #定义一个会话，启动默认图

result = sess.run(product)    #调用sess的run方法来执行矩阵乘法op，run（product）触发了图中的3个op

print(result)

sess.close   #关闭会话

#执行结果

[[15]]

#上述程序关于启动默认图有一个简单写法

sess = tf.Session()

result = sess.run(product)

print(result)

sess.close

等价表达方式：

with tf.Session() as sess:

    result = sess.run(product)

    print(result)

四、Tensorflow变量介绍

#变量介绍

import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

import tensorflow as tf

x = tf.Variable([1,2])     #创建一个变量op

a = tf.constant([3,3])      #创建一个常量op

sub_m = tf.subtract(x,a)     #创建一个减法op

add_m = tf.add(x,sub_m)     #创建一个加法op

init = tf.global_variables_initializer()    #变量初始化（要想使用变量，必须写这句代码）

with tf.Session() as sess:      #定义一个会话，启动默认图

    sess.run(init)             #触发变量op

    print(sess.run(sub_m))

    print(sess.run(add_m))

# 要想使用变量，必须进行变量初始化

init = tf.global_variables_initializer()

#利用程序实现自增1

import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

import tensorflow as tf

state = tf.Variable(0,name='counter')     #创建一个变量op，并初始化为0

new_value = tf.add(state,1)        #创建一个op，作用是使state加1

update = tf.assign(state,new_value)    #赋值op

init = tf.global_variables_initializer()     #变量初始化

with tf.Session() as sess:

    sess.run(init)

    print(sess.run(state))

    for _ in range(5):

        sess.run(update)

        print(sess.run(state))

#执行结果

0

1

2

3

4

5

五、Tensorflow（fetch和feed）

fetch：在会话中可以运行多个op

#举例理解

import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

import tensorflow as tf

input1 = tf.constant(3.0)

input2 = tf.constant(2.0)

input3 = tf.constant(5.0)

add_m = tf.add(input2,input3)

mul = tf.multiply(input1,add_m)

with tf.Session() as sess:

    result = sess.run([mul,add_m])   #运行多个op

    print(result)

#执行结果

[21.0, 7.0]

feed：feed的数据以字典的形式传入

import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

import tensorflow as tf

input1 = tf.placeholder(tf.float32)

input2 = tf.placeholder(tf.float32)

output = tf.multiply(input1,input2)

with tf.Session() as sess:

    print(sess.run(output,feed_dict={input1:[8.],input2:[2.]}))    #feed：feed的数据以字典的形式传入

六、利用tensorflow 实现简单线性回归

import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

import tensorflow as tf

import numpy as np

#使用numpy生成100个随机点

x_data = np.random.rand(100)

y_data = x_data * 0.1 + 0.2

#构造一个线性模型

b = tf.Variable(0.0)

k = tf.Variable(0.0)

y = k * x_data + b

#二次代价函数

loss = tf.reduce_mean(tf.square(y_data-y))

#定义一个梯度下降算法来进行训练的优化器

optimizer = tf.train.GradientDescentOptimizer(0.2)

#最小化代价函数

train = optimizer.minimize(loss)

#初始化变量

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    for step in range(201):

        sess.run(train)

        if step % 20 == 0:

            print(step,sess.run([k,b]))

#执行结果

0 [0.057367731, 0.1013036]

20 [0.10604427, 0.19655526]

40 [0.10355464, 0.19797418]

60 [0.10209047, 0.19880863]

80 [0.10122941, 0.19929935]

100 [0.10072301, 0.19958796]

120 [0.10042521, 0.19975767]

140 [0.10025007, 0.19985747]

160 [0.10014708, 0.19991617]

180 [0.10008651, 0.1999507]

200 [0.10005087, 0.19997101]

#训练200次后，k的值为0.10005087，接近0.1；b的值为0.19997101，接近0.2.

机器学习与Tensorflow（1）——机器学习基本概念、tensorflow实现简单线性回归的更多相关文章

机器学习的敲门砖：手把手教你TensorFlow初级入门
摘要: 在开始使用机器学习算法之前,我们应该首先熟悉如何使用它们. 而本文就是通过对TensorFlow的一些基本特点的介绍,让你了解它是机器学习类库中的一个不错的选择. 本文由北邮@爱可可-爱生活 ...
TensorFlow.NET机器学习入门【1】开发环境与类型简介
项目开发环境为Visual Studio 2019 + .Net 5 创建新项目后首先通过Nuget引入相关包: SciSharp.TensorFlow.Redist是Google提供的TensorF ...
TensorFlow.NET机器学习入门【0】前言与目录
曾经学习过一段时间ML.NET的知识,ML.NET是微软提供的一套机器学习框架,相对于其他的一些机器学习框架,ML.NET侧重于消费现有的网络模型,不太好自定义自己的网络模型,底层实现也做了高度封装. ...
TensorFlow.NET机器学习入门【2】线性回归
回归分析用于分析输入变量和输出变量之间的一种关系,其中线性回归是最简单的一种. 设: Y=wX+b,现已知一组X(输入)和Y(输出)的值,要求出w和b的值. 举个例子:快年底了,销售部门要发年终奖了, ...
TensorFlow.NET机器学习入门【3】采用神经网络实现非线性回归
上一篇文章我们介绍的线性模型的求解,但有很多模型是非线性的,比如: 这里表示有两个输入,一个输出. 现在我们已经不能采用y=ax+b的形式去定义一个函数了,我们只能知道输入变量的数量,但不知道某个变量 ...
TensorFlow.NET机器学习入门【4】采用神经网络处理分类问题
上一篇文章我们介绍了通过神经网络来处理一个非线性回归的问题,这次我们将采用神经网络来处理一个多元分类的问题. 这次我们解决这样一个问题:输入一个人的身高和体重的数据,程序判断出这个人的身材状况,一共三 ...
TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别（MNIST）
从这篇文章开始,终于要干点正儿八经的工作了,前面都是准备工作.这次我们要解决机器学习的经典问题,MNIST手写数字识别. 首先介绍一下数据集.请首先解压:TF_Net\Asset\mnist_png. ...
TensorFlow.NET机器学习入门【6】采用神经网络处理Fashion-MNIST
"如果一个算法在MNIST上不work,那么它就根本没法用:而如果它在MNIST上work,它在其他数据上也可能不work". -- 马克吐温上一篇文章我们实现了一个MNIST手 ...
TensorFlow.NET机器学习入门【7】采用卷积神经网络（CNN）处理Fashion-MNIST
本文将介绍如何采用卷积神经网络(CNN)来处理Fashion-MNIST数据集. 程序流程如下: 1.准备样本数据 2.构建卷积神经网络模型 3.网络学习(训练) 4.消费.测试除了网络模型的构建, ...

随机推荐

[转]图解CSS的padding,margin,border属性(详细介绍及举例说明)
图解CSS的padding,margin,border属性 W3C组织建议把所有网页上的对像都放在一个盒(box)中,设计师可以通过创建定义来控制这个盒的属性,这些对像包括段落.列表.标题.图片以及层 ...
mysql 设置外键四大属性 CASCADE SET NULL NO ACTION RESTRICT 理解
CASCADE:主表delete.update的时候,从表会delete.update掉关联记录: SET NULL:主表delete.update的时候,从表会将关联记录的外键字段所在列设为null ...
Docker Compose demo 使用
1.docker compose 安装 curl -L "https://github.com/docker/compose/releases/download/1.22.0/docker- ...
关于矩阵A*b=A*c 中b是否等于c
注意如果A各列线性无关那么b=c,反之b!=c, 针对最小二乘中的 p=A * roof_x A' ( b-p)=0 => A'b =A' p 如果两边同乘以A , ...
mathematica入门学习记录：
http://v.qq.com/vplus/4bc1736725fc7c3567d5bd9617482a49/foldervideos/m8k0000011aqj4k mathematica的数据简 ...
POJ 3388 Japanese Puzzle (二分)
题意:给你一个n*n 的图,你总共有k 种花砖,告诉你每一种花砖的个数,让你随便安排它们的位置,问你最多有多少行和第一行是一样,并且要输出第一行的一定存在的图案. 析:首先这个题如果读懂了题意,一点也 ...
Django工程搭建
-----环境安装 1.创建虚拟环境 mkvirtualenv django_py3_1.11 -p python3 2.安装django pip install django==1.11.11 ...
【repost】Chrome 控制台console的用法
下面我们来看看console里面具体提供了哪些方法可以供我们平时调试时使用. 目前控制台方法和属性有: ["$$", "$x", "dir" ...
POJ2229--Sumsets(动态规划)
Farmer John commanded his cows to search for different sets of numbers that sum to a given number. T ...
《mysql必知必会》学习_sql文件导入数据库_20180724_欢
解决问题1:MySQL中导入sql文件. 步骤1:show databases;#看看我有什么数据库步骤2:use hh;#我要用hh这个数据库,返回database changed说明打开成功. ...

机器学习与Tensorflow（1）——机器学习基本概念、tensorflow实现简单线性回归