机器学习常用sklearn库
Sklearn.model_selection(模型选择)
Cross_val_score:交叉验证
Train_test_split:数据切割
GridsearchCV:网格搜索
Sklearn.metrics(覆盖了分类任务中大部分常用验证指标)
Confusion_matrix(y_test,y_predict):混淆矩阵
Classification_report(y_test,y_predict):分类报告
Precision_score(test_y,prey):精确率
recall_score(test_y,prey):召回率
F1_score(test_y,prey):F1值
Roc_auc_score(test_y,prey):AUC值
Roc_curve(test_y,prepro[:,1]):ROC曲线参数
Mean_squared_error:均方差
R2_score:R2决定系数
Sklearn.tree(决策树)
DecisionTreeClassifier:分类决策树
DecisionTreeRegression:回归决策树
Export_graphviz():生成决策树图片
export_graphviz(best_dt,'best_dt.dot')
os.system('dot -Tjpg best_dt.dot -o 1604C.jpg')
Sklearn.decomposition(分解降维)
PCA:降维
explained_variance_ratio_ :每一行对应的等级数集
TruncatedSVD:文本降维
Sklearn.cluster(聚类)
Kmeans:K均值
AgglomerativeClustering:层次聚类
DBSCAN:密度聚类
Sklearn.linear_model(线性回归)
Lasson:L1正则化
ridge:岭回归L2正则化
LinearRegression:线性回归
Sklearn.ensemble(集成算法)
RandomForestClassifier:随机森林
ExtraTreesClassifier:极限随机树
AdaBoostClassifier:Adaboost算法(弱学习器)
GradientBoostingClassifier:GBDT(梯度提升回归树)算法
Sklearn.neighbors(邻近)
KNeighborsClassifier:KNN算法
Sklearn.svm
SVC:支持向量机
Sklearn.naive_bayes(朴素贝叶斯算法)
GaussionNB:高斯朴素贝叶斯
MultionmialNB:多项式朴素贝叶斯
BernoulliNB:伯努利朴素贝叶斯(分词)
Sklearn.proprecessing(数据预处理)
oneHotEncoder:独热编码
MinMaxscaler:线性归一化
StandardScaler:标准差归一化
LabelEncoder:数值标准化(类别特征转数值特征)
polynomialFeatures:多项式
Sklearn.feature_extraction.text(特征文本抽取)
CountVectorizer:词向量化
Sklearn.pipeline:管道
Pipeline:管道
Jieba
analyse:文本分析
Analyse.extract_tags 方法,提取排名靠前的关键词
Posseg:词性
Posseg.lcut() 方法,词性标注
Gensim
Corpora:全集
Corpora.Dictionary() 方法,构建词典
Models:模型
Models.Ldamodel() 方法,建立LDA主题模型,生成主题
From sqlalchemy import create_engine 连接mysql数据库
create_engine("mysql+pymysql://root:root@localhost:3306/pysql")
from wordcloud import WordCloud : 云词图
From PIL import Image 读取图片
wordcloud=WordCloud(font_path="simhei.ttf",background_color="white",max_font_size=80,mask=image)
机器学习常用sklearn库的更多相关文章
- Python机器学习笔记:sklearn库的学习
网上有很多关于sklearn的学习教程,大部分都是简单的讲清楚某一方面,其实最好的教程就是官方文档. 官方文档地址:https://scikit-learn.org/stable/ (可是官方文档非常 ...
- 2.sklearn库中的标准数据集与基本功能
sklearn库中的标准数据集与基本功能 下面我们详细介绍几个有代表性的数据集: 当然同学们也可以用sklearn机器学习函数来挖掘这些数据,看看可不可以捕捉到一些有趣的想象或者是发现: 波士顿房价数 ...
- 1.sklearn库的安装
sklearn库 sklearn是scikit-learn的简称,是一个基于Python的第三方模块.sklearn库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的 ...
- Python: sklearn库——数据预处理
Python: sklearn库 —— 数据预处理 数据集转换之预处理数据: 将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化. 原因:数据集的标准化(服从均值为 ...
- 【机器学习】SKlearn + XGBoost 预测 Titanic 乘客幸存
Titanic 数据集是从 kaggle下载的,下载地址:https://www.kaggle.com/c/titanic/data 数据一共又3个文件,分别是:train.csv,test.csv, ...
- day-10 sklearn库实现SVM支持向量算法
学习了SVM分类器的简单原理,并调用sklearn库,对40个线性可分点进行训练,并绘制出图形画界面. 一.问题引入 如下图所示,在x,y坐标轴上,我们绘制3个点A(1,1),B(2,0),C(2,3 ...
- Python数据分析常用的库总结
Python之所以能够成为数据分析与挖掘领域的最佳语言,是有其独特的优势的.因为他有很多这个领域相关的库可以用,而且很好用,比如Numpy.SciPy.Matploglib.Pandas.Scikit ...
- 复盘一篇讲sklearn库学习文章(上)
认识 sklearn 官网地址: https://scikit-learn.gor/stable/ 从2007年发布以来, scikit-learn已成为重要的Python机器学习库, 简称sklea ...
- Python常用的库简单介绍一下
Python常用的库简单介绍一下fuzzywuzzy ,字符串模糊匹配. esmre ,正则表达式的加速器. colorama 主要用来给文本添加各种颜色,并且非常简单易用. Prettytable ...
随机推荐
- docker for mac
MacOS上通过docker部署 docker环境准备 1.访问这里安装好docker,需要注册账号才能下载dmg安装包:https://hub.docker.com/editions/communi ...
- JSP数据库插入判断
- JVM学习02:GC垃圾回收和内存分配
JVM学习02:GC垃圾回收和内存分配 写在前面:本系列分享主要参考资料是 周志明老师的<深入理解Java虚拟机>第二版. GC垃圾回收和内存分配知识要点Xmind梳理 案例分析1-(G ...
- .Net圈子里的一些看法
金三银四招聘季,不一定一定要跳巢,但是出去看看行情还是有必要的,所以就有这篇随笔. 首先,这里说的.Net圈子是只两个方面 第一,技术人才,属于人的圈子 第二,技术本身,技术的圈子,也就是技术所涵盖的 ...
- centos7下编译安装php7.3
一.下载php7.3的源码 https://www.php.net/downloads.php 下载php-7.3.4.tar.gz 二.安装gcc,gcc-c++,kernel-devel yum ...
- 20175234 2018-2019-2 《Java程序设计》第七周学习总结
目录 20175234 2018-2019-2 <Java程序设计>第七周学习总结 教材学习内容总结 String类常用用法 Date类与Calendar类常用用法 Math类的常用方法 ...
- android 7.0 调用系统相机崩溃的解决方案(非谷歌官方推荐)
解决方案: 1.(推荐)7.0之后你的app就算有权限,给出一个URI之后手机也认为你没有权限. 不用修改原有代码,在Application的oncreate方法中:(或者直接放在调用相机的activ ...
- [Git] 拉开发分支的代码报错
Git拉开发分支的代码报错: fatal: The remote end hung up unexpectedly fatal: early EOF fatal: index-pack failed ...
- concurrent.futures性能阐述
python因为其全局解释器锁GIL而无法通过线程实现真正的平行计算.这个论断我们不展开,但是有个概念我们要说明,IO密集型 vs. 计算密集型. IO密集型:读取文件,读取网络套接字频繁. 计算密集 ...
- godoc
Godoc-一个Go代码文档化工具 Python - Docstring Java - javadoc