Sklearn.model_selection(模型选择)

Cross_val_score:交叉验证

Train_test_split:数据切割

GridsearchCV:网格搜索

Sklearn.metrics(覆盖了分类任务中大部分常用验证指标)

Confusion_matrix(y_test,y_predict):混淆矩阵

Classification_report(y_test,y_predict):分类报告

Precision_score(test_y,prey):精确率

recall_score(test_y,prey):召回率

F1_score(test_y,prey):F1值

Roc_auc_score(test_y,prey):AUC值

Roc_curve(test_y,prepro[:,1]):ROC曲线参数

Mean_squared_error:均方差

R2_score:R2决定系数

Sklearn.tree(决策树)

DecisionTreeClassifier:分类决策树

DecisionTreeRegression:回归决策树

Export_graphviz():生成决策树图片

export_graphviz(best_dt,'best_dt.dot')

os.system('dot -Tjpg best_dt.dot -o 1604C.jpg')

Sklearn.decomposition(分解降维)

PCA:降维

explained_variance_ratio_ :每一行对应的等级数集

TruncatedSVD:文本降维

Sklearn.cluster(聚类)

Kmeans:K均值

AgglomerativeClustering:层次聚类

DBSCAN:密度聚类

Sklearn.linear_model(线性回归)

Lasson:L1正则化

ridge:岭回归L2正则化

LinearRegression:线性回归

Sklearn.ensemble(集成算法)

RandomForestClassifier:随机森林

ExtraTreesClassifier:极限随机树

AdaBoostClassifier:Adaboost算法(弱学习器)

GradientBoostingClassifier:GBDT(梯度提升回归树)算法

Sklearn.neighbors(邻近)

KNeighborsClassifier:KNN算法

Sklearn.svm

SVC:支持向量机

Sklearn.naive_bayes(朴素贝叶斯算法)

GaussionNB:高斯朴素贝叶斯

MultionmialNB:多项式朴素贝叶斯

BernoulliNB:伯努利朴素贝叶斯(分词)

Sklearn.proprecessing(数据预处理)

oneHotEncoder:独热编码

MinMaxscaler:线性归一化

StandardScaler:标准差归一化

LabelEncoder:数值标准化(类别特征转数值特征)

polynomialFeatures:多项式

Sklearn.feature_extraction.text(特征文本抽取)

CountVectorizer:词向量化

Sklearn.pipeline:管道

Pipeline:管道

Jieba

analyse:文本分析

Analyse.extract_tags 方法,提取排名靠前的关键词

Posseg:词性

Posseg.lcut() 方法,词性标注

Gensim

Corpora:全集

Corpora.Dictionary() 方法,构建词典

Models:模型

Models.Ldamodel() 方法,建立LDA主题模型,生成主题

From sqlalchemy import create_engine  连接mysql数据库

create_engine("mysql+pymysql://root:root@localhost:3306/pysql")

from wordcloud import WordCloud : 云词图

From PIL import Image          读取图片

wordcloud=WordCloud(font_path="simhei.ttf",background_color="white",max_font_size=80,mask=image)

机器学习常用sklearn库的更多相关文章

  1. Python机器学习笔记:sklearn库的学习

    网上有很多关于sklearn的学习教程,大部分都是简单的讲清楚某一方面,其实最好的教程就是官方文档. 官方文档地址:https://scikit-learn.org/stable/ (可是官方文档非常 ...

  2. 2.sklearn库中的标准数据集与基本功能

    sklearn库中的标准数据集与基本功能 下面我们详细介绍几个有代表性的数据集: 当然同学们也可以用sklearn机器学习函数来挖掘这些数据,看看可不可以捕捉到一些有趣的想象或者是发现: 波士顿房价数 ...

  3. 1.sklearn库的安装

    sklearn库 sklearn是scikit-learn的简称,是一个基于Python的第三方模块.sklearn库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的 ...

  4. Python: sklearn库——数据预处理

    Python: sklearn库 —— 数据预处理 数据集转换之预处理数据:      将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化.      原因:数据集的标准化(服从均值为 ...

  5. 【机器学习】SKlearn + XGBoost 预测 Titanic 乘客幸存

    Titanic 数据集是从 kaggle下载的,下载地址:https://www.kaggle.com/c/titanic/data 数据一共又3个文件,分别是:train.csv,test.csv, ...

  6. day-10 sklearn库实现SVM支持向量算法

    学习了SVM分类器的简单原理,并调用sklearn库,对40个线性可分点进行训练,并绘制出图形画界面. 一.问题引入 如下图所示,在x,y坐标轴上,我们绘制3个点A(1,1),B(2,0),C(2,3 ...

  7. Python数据分析常用的库总结

    Python之所以能够成为数据分析与挖掘领域的最佳语言,是有其独特的优势的.因为他有很多这个领域相关的库可以用,而且很好用,比如Numpy.SciPy.Matploglib.Pandas.Scikit ...

  8. 复盘一篇讲sklearn库学习文章(上)

    认识 sklearn 官网地址: https://scikit-learn.gor/stable/ 从2007年发布以来, scikit-learn已成为重要的Python机器学习库, 简称sklea ...

  9. Python常用的库简单介绍一下

    Python常用的库简单介绍一下fuzzywuzzy ,字符串模糊匹配. esmre ,正则表达式的加速器. colorama 主要用来给文本添加各种颜色,并且非常简单易用. Prettytable ...

随机推荐

  1. css: box-sizing

    border-box 宽度包含了边框 content-box 边框不包含在内容区中,会增加到实际的宽度中

  2. vue使用qrcode插件生成二维码

    参考:https://www.jianshu.com/p/d3883e020d99 步骤: 第一步:vue-cli下载插件 cnpm install --save qrcodejs2 第二步:组件中引 ...

  3. easyui 传递参数报错(错误:uncaught SyntaxError: Unexpected identifier)

    转自:https://www.cnblogs.com/javaboy2018/p/8733585.html 代码: 按钮事件: function formatOper(val, row, index) ...

  4. VS2008打上SP1的补丁后安装了silverlight后出现未将对象引用设置到对象实例的解决办法

    新建silverlight项目失败,提示 未将对象设置到实例 的解决办法: 1.打开 visual studio 命令提示 输入一下命令:2.devenv /resetskippkgs ,这条命令会启 ...

  5. Python-lambda表达式和推导式

    lambda表达式和推导式,可实现使用一行语句完成功能开发的效果,减少代码量. 1.lambda表达式 匿名函数,即没有名字的函数 1.1基本语法: lambda argument_list: exp ...

  6. 《剑指Offer》第1题(Java实现):在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。

    一.题目描述 在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该 ...

  7. functools 之 partial(偏函数)

    当函数的参数个数太多,需要简化时,使用functools.partial可以创建一个新的函数,这个新函数可以固定住原函数的部分参数,从而在调用时更简单.当然,decorator(装饰器) 也可以实现, ...

  8. C# 线程获取/设置控件(TextBox)值

    线程读写控件需要用委托(delegate)与Invoke/BeginInvoke来进行 参考内容:http://www.cnblogs.com/runner/archive/2011/12/30/23 ...

  9. LogXGEController: Error: XGE version 8.01 (build 1867) or higher is required for XGE shader

    找到Engine/Config/ConsoleVariables.ini 禁用XGEShaderCompile就可以了

  10. .Net 配置的简陋解决方案

    公司是做CS产品的, 最近分配给我一个活, 要求:     1. 公司程序启动时, 检测是否有配置文件, 没有的话则按默认值创建一个     2. 配置文件要加密, 不能让客户随便看到里面的参数   ...