结合sklearn的可视化工具Yellowbrick：超参与行为的可视化带来更优秀的实现

https://blog.csdn.net/qq_34739497/article/details/80508262

Yellowbrick 是一套名为「Visualizers」的视觉诊断工具，它扩展了 Scikit-Learn API 以允许我们监督模型的选择过程。简而言之，Yellowbrick 将 Scikit-Learn 与 Matplotlib 结合在一起，并以传统 Scikit-Learn 的方式对模型进行可视化。

可视化器
可视化器（Visualizers）是一种从数据中学习的估计器，其主要目标是创建可理解模型选择过程的可视化。在 Scikit-Learn 的术语中，它们类似于转换器（transformer），其在可视化数据空间或包装模型估计器上类似「ModelCV」（例如 RidgeCV 和 LassoCV）方法的过程。Yellowbrick 的主要目标是创建一个类似于 Scikit-Learn 的 API，其中一些流行的可视化器包括：

特征可视化
- Rank Features：单个或成对特征排序以检测关系
- Radial Visualization：围绕圆形图分离实例
- PCA Projection：基于主成分分析映射实例
- Manifold Visualization：通过流形学习实现高维可视化
- Feature Importances：基于模型性能对特征进行排序
- Recursive Feature Elimination：按重要性搜索最佳特征子集
- Scatter and Joint Plots：通过特征选择直接进行数据可视化
分类可视化
- Class Balance：了解类别分布如何影响模型
- Class Prediction Error：展示分类的误差与主要来源
- Classification Report：可视化精度、召回率和 F1 分数的表征
- ROC/AUC Curves：受试者工作曲线和曲线下面积
- Confusion Matrices：类别决策制定的视觉描述
- Discrimination Threshold：搜索最佳分离二元类别的阈值
回归可视化
- Prediction Error Plots：沿着目标域寻找模型崩溃的原因
- Residuals Plot：以残差的方式展示训练和测试数据中的差异
- Alpha Selection：展示 alpha 的选择如何影响正则化
聚类可视化
- K-Elbow Plot：使用肘法（elbow method）和多个指标来选择 k
- Silhouette Plot：通过可视化轮廓系数值来选择 k
模型选择可视化
- Validation Curve：对模型的单个超参数进行调整
- Learning Curve：展示模型是否能从更多的数据或更低的复杂性中受益
文本可视化
- Term Frequency：可视化语料库中词项的频率分布
- t-SNE Corpus Visualization：使用随机近邻嵌入来投影文档
实例

#特征之间协方差可视化

from yellowbrick.features import Rank2D

from sklearn.datasets import load_iris

data=load_iris()

visualizer = Rank2D(features=data['feature_names'], algorithm='covariance')

visualizer.fit(data['data'], data['target']) # Fit the data to the visualizer

visualizer.transform(data['data']) # Transform the data

visualizer.poof() # Draw/show/poof the data

#梯度提升树中特征重要性可视化

import matplotlib.pyplot as plt

from sklearn.ensemble import GradientBoostingClassifier

from yellowbrick.features import FeatureImportances

from sklearn.datasets import load_iris

data=load_iris()

fig = plt.figure()

ax = fig.add_subplot()

viz = FeatureImportances(GradientBoostingClassifier(), relative=False)

viz.fit(data['data'],data['target']) # Fit the data to the visualizer

viz.poof() # Draw/show/poof the data

#线性支持向量机ROC曲线可视化

from sklearn.svm import LinearSVC

from yellowbrick.classifier import ROCAUC

model = LinearSVC()

model.fit(data['data'],data['target'])

visualizer = ROCAUC(model)

visualizer.score(data['data'],data['target'])

visualizer.poof()

#主成分分析二维降维可视化

from yellowbrick.features.pca import PCADecomposition

visualizer = PCADecomposition(scale=True, center=False, color="g", proj_dim=2)

visualizer.fit_transform(data['data'],data['target'])

visualizer.poof()

#线性支持向量机准确率、召回率、f1-score可视化

from sklearn.svm import LinearSVC

from yellowbrick.classifier import ClassificationReport

from sklearn.model_selection import train_test_split

model = LinearSVC()

X_train, X_test, y_train, y_test = train_test_split(data['data'],data['target'], test_size=0.2)

visualizer = ClassificationReport(model, classes=data['target_names'])

visualizer.fit(X_train, y_train)  # Fit the visualizer and the model

visualizer.score(X_test, y_test)  # Evaluate the model on the test data

g = visualizer.poof()             # Draw/show/poof the data

#alpha 的选择如何影响正则化可视化

import numpy as np

from sklearn.linear_model import LassoCV

from yellowbrick.regressor import AlphaSelection

# Create a list of alphas to cross-validate against

alphas = np.logspace(-10, 1, 400)#以10为底对数，-10到1分成400份

# Instantiate the linear model and visualizer

model = LassoCV(alphas=alphas)

visualizer = AlphaSelection(model)

visualizer.fit(data['data'],data['target'])

g = visualizer.poof()

#肘部法则选择最佳聚类的k

from sklearn.cluster import MiniBatchKMeans

from yellowbrick.cluster import KElbowVisualizer

# Instantiate the clustering model and visualizer

visualizer = KElbowVisualizer(MiniBatchKMeans(), k=(4,12))

visualizer.fit(data["data"]) # Fit the training data to the visualizer

visualizer.poof() # Draw/show/poof the data

#训练集数量对模型表现可视化

import numpy as np

from sklearn.naive_bayes import MultinomialNB

from sklearn.model_selection import StratifiedKFold

from yellowbrick.model_selection import LearningCurve

# Create the learning curve visualizer

cv = StratifiedKFold(12)#k折交叉切分

sizes = np.linspace(0.3, 1.0, 10)

viz = LearningCurve(

    MultinomialNB(), cv=cv, train_sizes=sizes,

    scoring='f1_weighted', n_jobs=4

)

# Fit and poof the visualizer

viz.fit(data['data'],data['target'])

viz.poof()

结合sklearn的可视化工具Yellowbrick：超参与行为的可视化带来更优秀的实现的更多相关文章

如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化展示
大前天我们通过Python网络爬虫对朋友圈的数据进行了抓取,感兴趣的朋友可以点击进行查看,如何利用Python网络爬虫抓取微信朋友圈的动态(上)和如何利用Python网络爬虫爬取微信朋友圈动态——附代 ...
Linux 上的数据可视化工具
Linux 上的数据可视化工具 5 种开放源码图形化工具简介 Linux® 上用来实现数据的图形可视化的应用程序有很多,从简单的 2-D 绘图到 3-D 制图,再到科学图形编程和图形模拟.幸运的是,这 ...
数据库——可视化工具Navicat、pymysql模块、sql注入问题
数据库--可视化工具Navicat.pymysql模块.sql注入问题 Navicat可视化工具 Navicat是数据库的一个可视化工具,可直接在百度搜索下载安装,它可以通过鼠标"点点点&q ...
Windows下Redis安装+可视化工具Redis Desktop Manager使用
Redis是有名的NoSql数据库,一般Linux都会默认支持.但在Windows环境中,可能需要手动安装设置才能有效使用.这里就简单介绍一下Windows下Redis服务的安装方法,希望能够帮到你. ...
开源来自百度商业前端数据可视化团队的超漂亮动态图表--ECharts
开源来自百度商业前端数据可视化团队的超漂亮动态图表--ECharts 本人项目中最近有需要图表的地方,偶然发现一款超级漂亮的动态图标js图表控件,分享给大家,觉得好用的就看一下.更多更漂亮的演示大家可 ...
redis_学习_02_redis 可视化工具 Redis Desktop Manager
二.参考资料 1.Redis可视化工具Redis Desktop Manager使用 2.超好用的Redis管理及监控工具,使用后可大大提高你的工作效率!
【Python代码】TSNE高维数据降维可视化工具 + python实现
目录 1.概述 1.1 什么是TSNE 1.2 TSNE原理 1.2.1入门的原理介绍 1.2.2进阶的原理介绍 1.2.2.1 高维距离表示 1.2.2.2 低维相似度表示 1.2.2.3 惩罚函数 ...
可能这是Redis可视化工具最全的横向评测
1 命令行不知道大家在日常操作redis时用什么可视化工具呢? 以前总觉得没有什么太好的可视化工具,于是问了一个业内朋友.对方回:你还用可视化工具?直接命令行呀,redis提供了这么多命令,操作起来 ...
企业必读：BI数据可视化工具选型
伴随着大数据时代的到来,企业对数据的需求从"IT主导的报表模式"转向"业务主导的自助分析模式",可视化BI工具也随之应运而生.面对如此众多的可视化BI工具,我们 ...

随机推荐

[sh]shift参数左移用法
shift概述 https://blog.csdn.net/wangjianno2/article/details/48879641 1.shell脚本中的位置参数 shell脚本中的位置参数有两种: ...
case关联表查询
select a.员工编号,b.`姓名`,b.`地址`,case when a.收入 is null then '没钱' when a.收入 < 2000 then '低收入'when a.收入 ...
export，import ，export default 彻底弄痛
ES6模块主要有两个功能:export和import 说白了就是一个淡出一个导入,就相当于以前的公共js样,哪个页面要用,就script 引入这个js ,然后无耻的调用这个js中的方法了. ex ...
VMware vSphere
在进行操作vSphere产品之前,就曾经对它进行过一个简单了解:[运维]VMware vSphere简单了解,现在再回头看,发现了解的真的是太简单了.经过前一段时间学习之后,对它又有了新的感悟,再来谈 ...
vue框架(三)_vue引入jquery、bootstrap
一.vue安装jquery 1.按照之前博客的内容,新建一个vue工程. 2.在项目文件夹下,使用命令npm install jquery --save-dev 引入jquery. 3.在build/ ...
powerdesign、navacat、ER图、uml、类图、时序图
关于建表和生成实体以及ER图的简便方法 a:用navacat客户端生成简单的ER图,并生成建表sql,执行生成表. b:用powerdesign连接数据库,反向生成带有注释的ER图. c:用ideal ...
四 js Math数学简单使用
//Math是全局的 //Math.PI 数学里的3.1415926.... console.log(Math.PI); //取随机数 //js提供的随机函数 Math.random() --> ...
2-2：python之控制结构
一.程序流程图 1.用规定的一系列图形.流程线和文字说明算法从开始到结束全部步骤,包括基本操作和控制流程.2.流程图的基本元素包括: 1) 表示相应操作的框 2) 带箭头的流程线 3) 框内必要的文 ...
hdu5371 manacher + 线段树
这题说的找出一个数组串 3等分第一个部分和第3个部分一样,第二个部分和第一个部分回文,那么计算出这些字符串问这样的字符串最长为多少,我们先使用manacher 计算出每个位置以他为对称轴左边端点的最 ...
skynet对Windows环境支持的版本：Windows版skynet
https://github.com/sanikoyes/skynet.git Skynet Skynet is a lightweight online game framework, and it ...

结合sklearn的可视化工具Yellowbrick：超参与行为的可视化带来更优秀的实现

特征可视化

分类可视化

回归可视化

聚类可视化

模型选择可视化

文本可视化

实例

结合sklearn的可视化工具Yellowbrick：超参与行为的可视化带来更优秀的实现的更多相关文章

随机推荐

热门专题