sklearn.datasets.make_blobs() 是用于创建多类单标签数据集的函数，它为每个类分配一个或多个正态分布的点集。

sklearn.datasets.make_blobs(
　　　　　　　　　　n_samples=100, 　　　　　　  # 待生成的样本的总数

　　　　　　　　　　n_features=2,   　　　　    # 每个样本的特征数

　　　　　　　　　　centers=3, 　　　　　　　    # 要生成的样本中心（类别）数，或者是确定的中心点

 　　　　　　　　　 cluster_std=1.0,　　　　    # 每个类别的标准差

 　　　　　　　　　 center_box=(-10.0, 10.0),  #中心确定之后的数据边界，亦即每个簇的上下限

 　　　　　　　　　 shuffle=True, 　　　　　　　 # 是否将样本打乱
　　　　　　　　　　random_state=None) 　　　　 #随机生成器的种子

参数的英文含义：

n_samples: int, optional (default=100)

The total number of points equally divided among clusters.

n_features: int, optional (default=2)

The number of features for each sample.

centers: int or array of shape [n_centers, n_features], optional (default=3)

The number of centers to generate, or the fixed center locations.

cluster_std: float or sequence of floats, optional (default=1.0)

The standard deviation of the clusters.

如果生成2类数据，其中一类比另一类具有更大的方差，可以将cluster_std设置为[1.0,3.0]。

center_box: pair of floats (min, max), optional (default=(-10.0, 10.0))

The bounding box for each cluster center when centers are generated at random.

shuffle: boolean, optional (default=True)

Shuffle the samples.

random_state: int, RandomState instance or None, optional (default=None)

If int, random_state is the seed used by the random number generator; If RandomState instance, random_state is the random number generator; If None, the random number generator is the RandomState instance used by np.random.

返回值

X : array of shape [n_samples, n_features]
The generated samples.
生成的样本数据集。

y : array of shape [n_samples]
The integer labels for cluster membership of each sample.
样本数据集的标签。

示例：

# 导入相关模块
from  sklearn.datasets import make_blobs

import matplotlib.pyplot as plt


# 创建仿真聚类数据集

X, y = make_blobs(n_samples=150,

                  n_features=2,

                  centers=3,

                  cluster_std=0.5,

                  shuffle=True,

                  random_state=0)


# 绘制散点图

plt.figure('百里希文', facecolor='lightyellow')

plt.scatter(X[:, 0], X[:, 1], c='w', edgecolor='k', marker='o', s=50)

plt.grid()

plt.show()

scikit-leanr 库中的 make_blobs() 函数的更多相关文章

numpy函数库中一些常用函数的记录
##numpy函数库中一些常用函数的记录最近才开始接触Python,python中为我们提供了大量的库,不太熟悉,因此在<机器学习实战>的学习中,对遇到的一些函数的用法进行记录. (1) ...
查找库中的某个函数，grep命令的用法。
程序中调用了某个库中的函数,我想知道这个函数具体的作用,就必须去看这个库的源代码. 那么问题来了:如何从库中众多的.h文件中,得知我想要的函数在哪个文件里? 最后用grep命令成功解决. 具体用法:先 ...
STL库中的正态分布函数
在设计抽奖一类程序中,有时会需要一种概率“有较大可能获得一个普通结果,有较小可能获得一个糟糕或极好的结果”,这就可以用正态分布函数来获得这样一个结果. STL中已经提供了一系列随机分布的函数,包括正态 ...
jquery.rotate.js库中的rotate函数怎么用。
rotate是jQuery旋转rotate插件,支持Internet Explorer 6.0+ .Firefox 2.0 .Safari 3 .Opera 9 .Google Chrome,高级浏览 ...
机器学习之numpy库中常用的函数介绍（一）
1. mat() mat()与array的区别: mat是矩阵,数据必须是2维的,是array的子集,包含array的所有特性,所做的运算都是针对矩阵来进行的. array是数组,数据可以是多维的,所 ...
Python标准库中的生成器函数
一.用于过滤的生成器函数 - 从输入的可迭代对象中产出元素的子集,而不修改元素本身 import itertools l1 = [1,2,3,4,5] l2 = [True,False,True,Fa ...
lua的table库中的常用函数总结
table是Lua语言中的一种重要的数据类型, table 的一些特性简单列举如下: (1).table 是一个“关联数组”,数组的索引可以是数字或者是字符串; (2).table 的默认初始索引一般 ...
python 生成器（四）：生成器基础（四）标准库中的生成器函数
os.walk 这个函数在遍历目录树的过程中产出文件名,因此递归搜索文件系统像for 循环那样简单. 用于过滤的生成器函数模块函数说明 itertools compress(it,sele ...
Python初探——sklearn库中数据预处理函数fit_transform()和transform()的区别
敲<Python机器学习及实践>上的code的时候,对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊,查阅了很多资料,这里整理一下: ...

随机推荐

在分页中，删除操作后，AJAX重载刷新当前页
需求分页中,在删除和编辑完成后,AJAX重载刷新当前页 ,而不是跳转到第一页实现步骤添加两个的 input 控件,用来存储当前页数和记录总条数(非必须,能有方法获取到这两个值即 ...
leetcode组合总和 Ⅳ 解题路径
题目: 关于动态规划类题目的思路如何找在上一篇博客 https://www.cnblogs.com/niuyourou/p/11964842.html 讲的非常清楚了,该博客也成为了了leetcode ...
About me & 友链
窝是图图小淘气面对世界很好奇啊呸抱歉拿错咧重来是他!是他!就是他! 我们滴朋友哦小哪吒! (汗又拿错咧菜鸡yxj 是来自美丽富饶的SDGR 的一名高中生每天最喜欢做的事就是花式被机 ...
区间DP（超详细！！！）
一.问题给定长为n的序列a[i],每次可以将连续一段回文序列消去,消去后左右两边会接到一起,求最少消几次能消完整个序列,n≤500. f[i][j]表示消去区间[i,j]需要的最少次数. 则; 若a ...
unityUIMask
Mask: 与Image组件配合工作,根据Image的覆盖区域来定位显示范围,所有该Image的子级UI元素,超出此区域的部分会被隐藏(包括UI的交互事件) 实现原理: Mask会赋予Image一个特 ...
Vue.js 源码分析(十二) 基础篇组件详解
组件是可复用的Vue实例,一个组件本质上是一个拥有预定义选项的一个Vue实例,组件和组件之间通过一些属性进行联系. 组件有两种注册方式,分别是全局注册和局部注册,前者通过Vue.component() ...
关于PHP Fatal error: Invalid handle returned
我在使用thinkphp5使用pdo的方式连接sqlserver的时候出现如此错误尝试了网上的多种方法 PHP Fatal error: Invalid handle returned 端口写在了 ...
java设计模式单例模式
创建型模式: – 单例模式.工厂模式.抽象工厂模式.建造者模式.原型模式. • 结构型模式: – 适配器模式.桥接模式.装饰模式.组合模式.外观模式.享元模式.代理模式. • 行为型模式: – 模版 ...
mongodb 更新数据时int32变为double的解决办法
场景: 在命令手动的修改签到表的整型字段synState,multi参数是可以更新多条,如果是false则更新一条. db.getCollection("ClassRecordOneD ...
sitemap 文件的生成 sitemap文件和sitemapindex 索引文件的生成
<?php /*****连接数据库 start*******/ $dbhost = "localhost"; $username = "root"; $u ...

scikit-leanr 库中的 make_blobs() 函数

返回值

scikit-leanr 库中的 make_blobs() 函数的更多相关文章

随机推荐

热门专题