sklearn学习总结(超全面)

关于sklearn,监督学习几种模型的对比

sklearn之样本生成
make_classification,
make_circles和make_moons

python np.logspace(1,10,5)

np.linspace() 创建等比数列,生成(start,stop)区间指定元素个数num的list,均匀分布
np.logspace() log分布间距生成list
np.arange() 生成(start,stop)区间指定步长step的list

numpy库:常用基本
https://www.cnblogs.com/smallpi/p/4550361.html

scikit-learn 中文文档
http://cwiki.apachecn.org/display/sklearn/Index
http://sklearn.apachecn.org/#/ (需要FQ)

模型评估: 量化预测的质量
https://blog.csdn.net/marsjhao/article/details/78678276

30分钟学会用scikit-learn的基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
https://blog.csdn.net/u010900574/article/details/52666291

很值得看的特征选择 方法
https://www.cnblogs.com/stevenlk/p/6543628.html

XGboost数据比赛实战之调参篇
https://blog.csdn.net/sinat_35512245/article/details/79700029
https://blog.csdn.net/han_xiaoyang/article/details/52665396

Scikit中的特征选择,XGboost进行回归预测,模型优化的完整过程
https://blog.csdn.net/sinat_35512245/article/details/79668363

机器学习入门--协同过滤算法[推荐算法]
https://blog.csdn.net/u012995888/article/details/79077681

TFIDF介绍
https://www.cnblogs.com/cppb/p/5976266.html

pyspark
http://www.code123.cc/1499.html
http://blog.jobbole.com/86232

sklearn线性回归,支持向量机SVR回归,随机森林回归,神经网络回归参数解释及示例
https://blog.csdn.net/manjhOK/article/details/80367624

LR模型常见问题小议
https://blog.csdn.net/starzhou/article/details/52220070

基于Python的信用评分卡模型分析
https://www.jianshu.com/p/f931a4df202c

一文搞定BP神经网络——从原理到应用(原理篇)
https://blog.csdn.net/u014303046/article/details/78200010

分类中解决类别不平衡问题
https://blog.csdn.net/program_developer/article/details/80287033

类别不平衡问题之SMOTE算法(Python imblearn极简实现)
https://blog.csdn.net/nlpuser/article/details/81265614
https://imbalanced-learn.org/en/stable/generated/imblearn.over_sampling.SMOTE.html

Lightgbm基本原理介绍
https://blog.csdn.net/qq_24519677/article/details/82811215
https://www.jianshu.com/p/b4ac0596e5ef

异常检测算法--Isolation Forest
https://www.cnblogs.com/fengfenggirl/p/iForest.html
https://blog.csdn.net/ye1215172385/article/details/79762317

RF,GBDT,XGBoost,lightGBM对比分析
https://blogsklearncsdn.net/zhangbaoanhadoop/article/details/81948726

GridSearchCV 与 RandomizedSearchCV 调参
https://blog.csdn.net/juezhanangle/article/details/80051256
http://www.pianshen.com/article/7662198758/

Python超参数自动搜索模块GridSearchCV上手
https://www.cnblogs.com/nwpuxuezha/p/6618205.html

sklearn浅析(一)——sklearn的组织结构
https://blog.csdn.net/qsczse943062710/article/details/75642666

Hive 窗口函数、分析函数
https://www.cnblogs.com/skyEva/p/5730531.html
Hive常用函数大全(二)(窗口函数、分析函数、增强group)
https://blog.csdn.net/scgaliguodong123_/article/details/60135385
Hive窗口函数 (非常详细)
https://blog.csdn.net/qq_26937525/article/details/54925827

特征选择 (feature_selection)
https://www.cnblogs.com/stevenlk/p/6543628.html

from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster("local").setAppName("My App")
sc = SparkContext(conf = conf)
lines = sc.textFile("first.py")
pythonLines = lines.filter(lambda line: "Python" in line)
print "hello python"
print pythonLines.first()
print pythonLines.first()
print "hello spark!"

skearn自学路径的更多相关文章

  1. 大学四年,总结一套适合小白的Java自学路线和方法

    前言篇 大家好,我是bigsai 好久不见,甚是想念,文章同时收录在回车课堂(文底阅读原文可达). 无论你是大学生还是在职人员,想学Java时,都会面临两个选择,自学或者报班.报班通常太费钱,时间又不 ...

  2. 值得网页设计师&前端收藏的实用工具列表

    原文地址:http://www.uisdc.com/tool-list-web-developers# 无论你是经验丰富的前端,还是刚刚起步的设计师,这些为真正的网页设计师和开发者所准备的实用工具.在 ...

  3. Sketch教程

    去年夏天开始用Sketch,觉得它放Dock里闪亮亮的很好看,当时笑称是男盆友送我的第一颗小钻石噗哈哈.所以那段时间几乎刷遍了所有关于 Sketch 的网站.文章.教程,之后又在自学设计,因为想和更多 ...

  4. python自学第11天-单线程并发、迭代器,序列化,获取路径

    单线程并发 import time def consumer(name): print("%s 准备吃包子了"%name) while True: baozi=yield#变成一个 ...

  5. 如何自学web安全(详细路径)

    看到学习路径,收藏一下https://blog.csdn.net/q251500/article/details/79441316

  6. .NET全栈开发工程师学习路径

    PS:最近一直反复地看博客园以前发布的一条.NET全栈开发工程师的招聘启事,觉得这是我看过最有创意也最朴实的一个招聘启事,更为重要的是它更像是一个技术提纲,能够指引我们的学习和提升,现在转载过来与各位 ...

  7. JavaWeb路径问题打包总结--小心出门右转404

    话说,培训和自学就不是一个回事,两周讲完java基础,两天讲完jsp,两节课讲完servlet,还真不是一般人能受得了的,这两天学习jsp和servlet频繁被路径问题困扰,倒不是出错,只是各种act ...

  8. 从零自学Hadoop(03):Linux准备上

    阅读目录 序 检查列表 常用Linux命令 搭建环境 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sou ...

  9. 从零自学Hadoop(07):Eclipse插件

    阅读目录 序 Eclipse Eclipse插件 新建插件项目 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写 ...

随机推荐

  1. WCF开发实战系列五:创建WCF客户端程序

    WCF开发实战系列五:创建WCF客户端程序 (原创:灰灰虫的家http://hi.baidu.com/grayworm) 在前面的三篇文章中我们分别介绍了WCF服务的三种载体:IIS.Self-Hos ...

  2. NFS无法启动解决方式

    今天一台挂载nfs磁盘的服务器出现异常,数据不能写入,执行 df -h 卡住不动. 登录nfs server查看发现nfs为启动. [root@server10-13 web]# exportfs [ ...

  3. 错误提示 nginx: [emerg] unknown directive "gzip_static"

    1.检查nginx配置文件错误提示如下: [root@server nginx]# /applications/nginx/sbin/nginx -t -c /applications/nginx/n ...

  4. maven的pom.xml文件标签含义

    pom作为项目对象模型.通过xml表示maven项目,使用pom.xml来实现.主要描述了项目:包括配置文件:开发者需要遵循的规则,缺陷管理系统,组织和licenses,项目的url,项目的依赖性,以 ...

  5. 整理备忘一波liunx命令(持续更新)

    # 分区挂载 查看当前目录下的文件大小 du --max-depth= -h # 文件操作 # 编辑操作 #liunx 字体设置 苹果方字体下载安装 # 网洛端口 netstat命令各个参数说明如下: ...

  6. KDevelop使用经验

    KDevelop中不显示行号: 1.上方菜单栏"编辑器"->查看->Show Line Numbers 2.设置->配置编辑器->Appearance-&g ...

  7. HDU - 4324 Triangle LOVE(拓扑排序)

    https://vjudge.net/problem/HDU-4324 题意 每组数据一个n表示n个人,接下n*n的矩阵表示这些人之间的关系,输入一定满足若A不喜欢B则B一定喜欢A,且不会出现A和B相 ...

  8. python 之禅 import this

    dongweiming的博客 前言 我这个博客一直都是一些技术分享,show code的地方,我从来没有写过个人生活或者情感杂谈,当然我也从来没有谈论过我对什么东西的喜恶. 很多人喜欢喷XX语言,喜欢 ...

  9. B - Birthday Boy Gym - 102007B

    题目链接:https://cn.vjudge.net/contest/283924#problem/B 题目大意:给你n个人的信息,让你找出一个时间,要求让你选择一天,使得这一天的前一个生日距离它最远 ...

  10. tidb 架构 ~Tidb学习系列(5)

    一 简介:今天我们继续学习tidb的增量传输 二 说明: tidb高度兼容mysql,可以仿照mysql的主从同步复制机制实现mysql->tidb的增量传输 三 实验: 1 下载tidb官方工 ...