机器学习：从sklearn中加载数据

一、sklearn模块

sklearn模块下有很多子模块，常用的数据集在：sklearn.datasets模块下；
通过数据集中DESCR来查看数据集的文档；

从datasets中加载数据：

import numpy as np

import matplotlib as mpl

import matplotlib.pyplot as plt

from sklearn import datasets

# 查看datasets中的数据，一般格式为：datasets.load_ + 数据集的名称（按Tab键可选择）；

iris = datasets.load_iris()

# 看到数据集中的内容种类，格式：数据集变量.keys()

iris.keys()

# 输出：dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])

# 则load_iris()数据集中有['data', 'target', 'target_names', 'DESCR', 'feature_names']内容；

# data：数据的具体数值；

# DESCR：数据集的文档；

# feature_name：特征名称；

# target：样本类别，是图标中的纵轴label，也即是样本的标记；

# target_names：样本类别数值的具体意思，一般target为数值，target_names为解释这些数值的语言；

# 查看数据集中的各类内容，格式：数据集变量.数据类别

iris.data

可视化数据：只能绘制二维数据；

# 取前两列/种特征值

X = iris.data[:, :2]

# 对两列数据绘散点图，两列特征值分别为横轴和纵轴

plt.scatter(X[:, 0], X[:, 1])

plt.show()

按target类型对散点图的点着色并显示：(y == 0返回一个布尔数组，此处目的是选取target = 0的行，即0类的样本)

y = iris.target

# marker表示点的样式

plt.scatter(X[y == 0, 0], X[y == 0, 1], color = 'red', marker = "o")

plt.scatter(X[y == 1, 0], X[y == 1, 1], color = 'blue', marker = "+")

plt.scatter(X[y == 2, 0], X[y == 2, 1], color = 'green', marker = "x")

plt.show()

如果所选的特征类型绘制出的散点图区别不明显，可以尝试选择其它特征进行绘图；

机器学习：从sklearn中加载数据的更多相关文章

Flexigrid从对象中加载数据
(有问题,在找…………) Flexigrid是用来动态加载数据的一种比较好(老)的Jquery表插件,然后有些时候,我们需要其从本地或者jQuery对象中加载数据,比如有这么个需求,页面显示中有两个表 ...
ArcGIS Engine中加载数据
ArcGIS Engine中加载数据 http://blog.csdn.net/gisstar/article/details/4206822 分类: AE开发积累2009-05-21 16:49 ...
ML.NET Cookbook --- 1.如何从文本文件中加载数据？
使用ML.NET中的TextLoader扩展方法从文本文件中加载数据.你需要知道在文本文件中数据列在那里,它们的类型是什么,在文本文件中什么位置可以找到它们. 请注意:对于ML.NET只读取文件的某些 ...
python数据可视化-matplotlib入门(6)-从文件中加载数据
前几篇都是手动录入或随机函数产生的数据.实际有许多类型的文件,以及许多方法,用它们从文件中提取数据来图形化. 比如之前python基础(12)介绍打开文件的方式,可直接读取文件中的数据,扩大了我们的数 ...
向treeview中加载数据
1.获取树节点的值,用事件AfterSelect加载(id值的获取,用name来获取) 2.双击treeview控件得到 private void treeView1_AfterSelect(obje ...
java多线程向数据库中加载数据
读取本地文件,每行为一条记录,文件大小550M,200万条数据.先将文件读取的内存中,再开启6个线程连接postgresql不同coordinator端口导入数据.代码如下: import java. ...
Vue完成页面切换中加载数据
created() { // 拿到路由传递来的car主键 let pk = this.$route.query.pk || this.$route.params.pk; // 主键不存在,就直接结束方 ...
DHTMLX 前端框架建立你的一个应用程序教程(六)-- 表格加载数据
从数据库加载数据这篇我们介绍从MySQL数据库中加载数据到表格我们使用 MySql的数据库dhtmlx_tutorial 和表contacts 示例使用的是PHP平台和dhtmlxConnecto ...
Android动画之仿美团加载数据等待时，小人奔跑进度动画对话框（附顺丰快递员奔跑效果）
Android动画之仿美团加载数据等待时,小人奔跑进度动画对话框(附顺丰快递员奔跑效果) 首句依然是那句老话,你懂得! finddreams :(http://blog.csdn.net/finddr ...

随机推荐

小程序发起post请求回调成功没有数据
get请求时为 header:{ "content-type":'application/json' },POST 请求会将data的值放在Request Payload里面,而不 ...
超轻量级、高性能C日志库--EasyLogger
[ 声明:版权全部,欢迎转载.请勿用于商业用途. 联系信箱:armink.ztl@gmail.com] EasyLogger 1. 介绍 EasyLogger 是一款超轻量级(ROM<1.6K, ...
Android Media应用开发
Java层API : AudioRecord 采集音频(PCM格式)AudioTrack 播放音频 Camera 用来采集摄像头的数据Surface / SurfaceView / GLSurface ...
pygame躲敌人的游戏
#first.py# coding=utf- import pygame from pygame.locals import * from sys import exit from util impo ...
[原创]关于在CentOS 7.0 下安装nfs ，遇见 Transaction check error问题的解决
今天小弟的同学在使用阿里云的服务器安装nfs的时候,出现了一下问题 Transaction check error: file /usr/lib/systemd/system/blk-availabi ...
sublime text的pylinter插件设置pylint_rc后提示错误
sublime text插件pylinter提示错误 Warning: option include-ids is deprecated and ignored. 错误本身是Python的错误,这说明 ...
第十篇、模块一、sys\os\hashlib模块的应用
一.模块分为三种 1)自定义模块 2)第三方模块 3)内置模块如何导入模块? 下面两种: 1)import 模块名字 as 别名(重新给模块命名) 2)from 模块名字 import 功能( ...
poj 1028 Web Navigation 【模拟题】
题目地址:http://poj.org/problem?id=1028 测试样例: Sample Input VISIT http://acm.ashland.edu/ VISIT http://ac ...
hihocoder 1142 三分求极值【三分算法模板应用】
#1142 : 三分·三分求极值时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述这一次我们就简单一点了,题目在此: 在直角坐标系中有一条抛物线y=ax^2+bx+c和一 ...
hdu 1701 (Binary Tree Traversals)（二叉树前序中序推后序）
Binary Tree Traversals T ...

机器学习：从sklearn中加载数据

一、sklearn模块

机器学习：从sklearn中加载数据的更多相关文章

随机推荐

热门专题