『Sklearn』框架自带数据集接口

自带数据集类型如下：

# 自带小型数据集
# sklearn.datasets.load_<name>
# 在线下载数据集
# sklearn.datasets.fetch_<name>
# 计算机生成数据集
# sklearn.datasets.make_<name>
# svmlight/libsvm格式数据集
# sklearn.datasets.load_svmlight_file(path)
# mldata.org在线下载网站数据集
# sklearn.datasets.fetch_mldata(path)

以鸢尾花数据为例，介绍一下自带数据集的使用。

基本使用：

import sklearn

import matplotlib.pyplot as plt

# 载入数据集

iris = sklearn.datasets.load_iris()  # 鸢尾花数据

# 打印数据集中的类型

print(iris.keys())

# dict_keys(['target', 'data', 'feature_names', 'DESCR', 'target_names'])

# target：标签

# data  ：数据

# feature_names ：特征名称，list，按照data中排序生成

# target_names   : 标签名称，list，按照target中排序生成

print(iris.target.shape)

print(iris.data.shape)

print(iris.feature_names)

print(iris.target_names)

# (150,)

# (150, 4)

# ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

# ['setosa' 'versicolor' 'virginica']

使用一个特征绘制柱状图：

x_index = 3

colors = ['blue', 'red', 'green']

for label, color in zip(range(len(iris.target_names)), colors):

    plt.hist(iris.data[iris.target==label, x_index],

             label = iris.target_names[label], color=color)

plt.xlabel(iris.feature_names[x_index])

plt.legend(loc='upper right')

plt.show()

使用两个特征绘制散点图：

x_index = 0

y_index = 1

colors = ['blue', 'red', 'green']

for label, color in zip(range(len(iris.target_names)), colors):

    plt.scatter(iris.data[iris.target == label, x_index],

                iris.data[iris.target == label, y_index],

                label=iris.target_names[label],   # 图例内容

                color=color)

plt.xlabel(iris.feature_names[x_index])

plt.ylabel(iris.feature_names[y_index])

plt.legend(loc='upper right')                    # 显示图例

plt.show()

其他自带小型数据集（load的）均同理，以后遇到教程使用时不用再慌了。

『Sklearn』框架自带数据集接口的更多相关文章

『Sklearn』特征向量化处理
『Kaggle』分类任务_决策树&集成模型&DataFrame向量化操作 1 2 3 4 5 6 7 8 9 '''特征提取器''' from sklearn.feature_extr ...
sklearn提供的自带数据集
sklearn 的数据集有好多个种自带的小数据集(packaged dataset):sklearn.datasets.load_<name> 可在线下载的数据集(Downloaded ...
『Sklearn』数据划分方法
原理介绍 K折交叉验证: KFold,GroupKFold,StratifiedKFold, 留一法: LeaveOneGroupOut,LeavePGroupsOut,LeaveOneOut,Lea ...
『计算机视觉』mini深度学习框架实现
一.项目简介手动实现mini深度学习框架,主要精力不放在运算优化上,仅体会原理. 地址见:miniDeepFrame 相关博客『TensorFlow』卷积层.池化层详解『科学计算』全连接层.均方 ...
『计算机视觉』Mask-RCNN_训练网络其一：数据集与Dataset类
Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习『计算机视觉』Mask-RCNN_项目文档翻译『计算机视觉』Mask-RCNN_推断网络其一:总览『计算机视觉』M ...
『TensorFlow』TFR数据预处理探究以及框架搭建
一.TFRecord文件书写效率对比(单线程和多线程对比) 1.准备工作 # Author : Hellcat # Time : 18-1-15 ''' import os os.environ[&q ...
sklearn提供的自带的数据集
sklearn 的数据集有好多个种自带的小数据集(packaged dataset):sklearn.datasets.load_<name> 可在线下载的数据集(Downloaded ...
Python——sklearn提供的自带的数据集
sklearn提供的自带的数据集 sklearn 的数据集有好多个种自带的小数据集(packaged dataset):sklearn.datasets.load_<name> 可在线下 ...
『Java』Collection接口 Collections类
接口Collection public interface Collection<E>定义了所有单列集合中共性的方法,所有的单列集合都可以使用共性方法. Collection的常用子接口有 ...

随机推荐

js 操作数字类型
1.内置函数 Number().parseInt().parseFloat() var num = "88.88abc888"; Number(num); ...
nginx日志过滤相同IP方法
nginx日志过滤相同IP方法分析nginx日志的时候,统计ip怎么过滤重复的?awk '{print $2}' nginx.log |sort -rn |uniq -c |sort -rn |hea ...
关于Spring中，定时任务执行两次的解决办法
原因:如果spring-quartz.xml文件,在Spring的配置文件spring-config.xml中被加载,那么定时任务会被Spring和SpringMVC扫描两次,所以会被执行两次. 解决 ...
web前端----jQuery动画效果
动画效果 // 基本 show([s,[e],[fn]]) hide([s,[e],[fn]]) toggle([s],[e],[fn]) // 滑动 slideDown([s],[e],[fn]) ...
LWIP裸机环境下实现TCP与UDP通讯（转）
源: LWIP裸机环境下实现TCP与UDP通讯
SQL学习之简单增删改查
SQL最常用的语句,就是增删改查: 增删改查的对象,分别是库(文件夹),表(文件),表的内容(表的记录): 一.创建一个基本的表 #create table Student_Info (Name VA ...
Jquery获取敲击回车时光标所在的位置
$(document).keyup(function(event){ ){ //是否是回车 var el = event.srcElement || event.target; var input_t ...
Delphi XE5 for Android （五）
Android程序开发必然用到按钮,在XE5下,按钮的一个比较重要的属性就是StyleLookup,预置了一系列常用的图标,如下图: 另外2个常用属性就是: GroupName和IsPressed:一 ...
2016年蓝桥杯B组C/C++省赛（预选赛）题目解析
2016年蓝桥杯B组C/C++ 点击查看2016年蓝桥杯B组省赛试题(无答案版) 第一题:煤球数目题解有一堆煤球,堆成三角棱锥形.具体: 第一层放1个, 第二层3个(排列成三角形), 第三层6个( ...
POJ 3468 A Simple Problem with Integers（线段树&区间更新）题解
Description You have N integers, A1, A2, ... , AN. You need to deal with two kinds of operations. On ...

『Sklearn』框架自带数据集接口

『Sklearn』框架自带数据集接口的更多相关文章

随机推荐

热门专题