数据标准化+网格搜索+交叉验证+预测（Python）

Download datasets iris_training.csv from:https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/tutorials/monitors

Method: SVR

# -*- coding: utf-8 -*-

import pandas as pd

from sklearn.grid_search import GridSearchCV

from sklearn import svm, datasets

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import StandardScaler

from sklearn.utils import shuffle

import numpy as np

from sklearn import metrics

df = pd.read_csv('iris_training.csv', header=0)

parameters = {'kernel':['rbf'], 'gamma':np.logspace(-5, 0, num=6, base=2.0),'C':np.logspace(-5, 5, num=11, base=2.0)}

grid_search = GridSearchCV(svm.SVR(), parameters, cv=10, n_jobs=4, scoring='mean_squared_error')

X = df[df.columns.drop('virginica')]

y = df['virginica']

X_train, X_test, y_train, y_test = train_test_split(\

    X, y, test_size=0.3, random_state=42)

random_seed = 13

X_train, y_train = shuffle(X_train, y_train, random_state=random_seed)

X_scaler = StandardScaler()

X_train = X_scaler.fit_transform(X_train)

X_test = X_scaler.transform(X_test)

grid_search.fit(X_train,y_train)

y_pred = grid_search.predict(X_test) 

print 'mean_squared_error:'+str(metrics.mean_squared_error(y_test,y_pred)),\

 'r2_score:'+str(metrics.r2_score(y_test,y_pred))

Neural Network:

# -*- coding: utf-8 -*-

import pandas as pd

from sklearn.grid_search import GridSearchCV

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import StandardScaler

from sklearn.utils import shuffle

import numpy as np

from sklearn import metrics

from sklearn.neural_network import MLPRegressor

df = pd.read_csv('iris_training.csv', header=0)

#neural networks for regresion

parameters = {'hidden_layer_sizes':[200,250,300,400,500,600], 'activation':['relu']}

grid_search = GridSearchCV(MLPRegressor(), parameters, cv=10, n_jobs=4, scoring='mean_squared_error')

X = df[df.columns.drop('virginica')]

y = df['virginica']

X_train, X_test, y_train, y_test = train_test_split(\

	X, y, test_size=0.3, random_state=42)

random_seed = 13

X_train, y_train = shuffle(X_train, y_train, random_state=random_seed)

X_scaler = StandardScaler()

X_train = X_scaler.fit_transform(X_train)

X_test = X_scaler.transform(X_test)

grid_search.fit(X_train,y_train)

y_pred = grid_search.predict(X_test) 

print 'mean_squared_error:'+str(metrics.mean_squared_error(y_test,y_pred)),\

 'r2_score:'+str(metrics.r2_score(y_test,y_pred))

数据标准化+网格搜索+交叉验证+预测（Python）的更多相关文章

scikit-learn一般实例之一:绘制交叉验证预测
本实例展示怎样使用cross_val_predict来可视化预测错误: # coding:utf-8 from pylab import * from sklearn import datasets ...
机器学习之路：python 网格搜索并行搜索 GridSearchCV 模型检验方法
git:https://github.com/linyi0604/MachineLearning 如何确定一个模型应该使用哪种参数? k折交叉验证: 将样本分成k份每次取其中一份做测试数据其他做训 ...
十折交叉验证10-fold cross validation, 数据集划分训练集验证集测试集
机器学习数据挖掘数据集划分训练集验证集测试集 Q:如何将数据集划分为测试数据集和训练数据集? A:three ways: 1.像sklearn一样,提供一个将数据集切分成训练集和测试集的函数 ...
机器学习--K折交叉验证和非负矩阵分解
1.交叉验证交叉验证(Cross validation),交叉验证用于防止模型过于复杂而引起的过拟合.有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法. 于是可以先在一个子集上做 ...
支持向量机(SVM)利用网格搜索和交叉验证进行参数选择
上一回有个读者问我:回归模型与分类模型的区别在哪?有什么不同,我在这里给他回答一下 : : : : 回归问题通常是用来预测一个值,如预测房价.未来的天气情况等等,例如一个产品的实际价格为500元,通过 ...
libsvm交叉验证与网格搜索（参数选择）
首先说交叉验证.交叉验证(Cross validation)是一种评估统计分析.机器学习算法对独立于训练数据的数据集的泛化能力(generalize), 能够避免过拟合问题.交叉验证一般要尽量满足:1 ...
Python之网格搜索与检查验证-5.2
一.网格搜索,在我们不确定超参数的时候,需要通过不断验证超参数,来确定最优的参数值.这个过程就是在不断,搜索最优的参数值,这个过程也就称为网格搜索. 二.检查验证,将准备好的训练数据进行平均拆分,分为 ...
机器学习 - 案例 - 样本不均衡数据分析 - 信用卡诈骗 ( 标准化处理, 数据不均处理, 交叉验证, 评估, Recall值, 混淆矩阵, 阈值 )
案例背景银行评判用户的信用考量规避信用卡诈骗 ▒ 数据数据共有 31 个特征, 为了安全起见数据已经向了模糊化处理无法读出真实信息目标其中数据中的 class 特征标识为是否正常用户 (0 代表 ...
Python机器学习笔记 Grid SearchCV（网格搜索）
在机器学习模型中,需要人工选择的参数称为超参数.比如随机森林中决策树的个数,人工神经网络模型中隐藏层层数和每层的节点个数,正则项中常数大小等等,他们都需要事先指定.超参数选择不恰当,就会出现欠拟合或者 ...

随机推荐

Java转义形如nbsp;的HTML编码
需要引用一个maven  <d ...
Codeforces Round #271 (Div. 2) E. Pillars 线段树优化dp
E. Pillars time limit per test 1 second memory limit per test 256 megabytes input standard input out ...
Selenium IDE使用
基于版本Selenium IDE 3.2.2(注:该工具不常用,可以使用定位元素是否存在) Selenium IDE可以录制也很方便,当然录下来的经常回放不成功,需要自己调试就是了.它是只针对Web页 ...
PHP中封装Redis购物车功能
<?php // 服务层 namespace Common\Service; use Vendor\Func\Red; class CartService extends CommonServi ...
[HTTP]_[C/C++]_[解析URL的转义字符百分比字符串]
场景: 1.有时候获取一个超链接时,或者一个图片src时,里面的地址带有%XX,这样如果当成文件路径处理会不识别.所以要把转义字符解码. 2.它其实就是ASCII码的十六进制表示. 以下是stacko ...
贪心 —— 今年暑假不AC
贪心基本题, 有助于理解贪心算法的思想 #include <cstdio> #include <algorithm> using namespace std; struct P ...
让DOM从页面中消失的方法
1. 在隐藏的方法中,display取none值这种方法一般是不可取的!因为display:none是直接不显示,也就是不渲染此元素,如果它所作用的元素排版在页面较前,先渲染,就容易引起回流(refl ...
vuex学习与实践——mapState、getter、mapGetters
1.mapState辅助函数当一个组件需要获取多个状态时候,将这些状态都声明为计算属性会有些重复和冗余.为了解决这个问题,我们可以使用 mapState 辅助函数帮助我们生成计算属性,让你少按几次键 ...
Dreamweaver 2
1.CSS样式基本应用 1.1 概念层叠样式表 <style type="text/css">body {background-color: #F00;} p{col ...
lua中的闭包概念的学习笔记
1.闭包的由来: 个人理解,lua中之所以出现闭包的概念,完全是因为lua中允许函数的嵌套定义,并且在内嵌函数中使用了外包函数中定义的局部变量,例如c.c#就不允许函数的嵌套定义(但是允许函数的嵌套调 ...

数据标准化+网格搜索+交叉验证+预测（Python）

数据标准化+网格搜索+交叉验证+预测（Python）的更多相关文章

随机推荐

热门专题