第二周<导学/分类>

分类学习####

分类算法各有不同

knn

naivebyes

regression

dnn

sklearn.linear_modlel 线性函数

sklearn.preprocessing 非线性函数

分类##

基本分类模型###

knn####

sklearn.neighbors.KNeighborsClassifier

n_neighbors

weights 设置选择k个点对分类效果的影响权重

uniform,distance

algothrim 计算临近点的方法 ball_tree kd_tree brute auto

...

实例介绍

neigh=KNeightborsClassifier(neigh)

neigh.fit(X,y)

neigh.predict([[1.1]])

决策树####

构造好的分类决策树

sklearn.tree.DecisionTreeClassifier

criterion : 用于选择属性的准侧，可以传入gini代表基尼系数,entropy代表信息增益

max_features: 表示节点分裂时，从所少个特征中选择最优特征，可以设定固定数木，百分比，或其他个数，默认是所有特征

人体姿态预测###

这个数据集好偏啊，运行效果并不好。

# -*- coding: utf-8 -*-

"""

Created on Wed May 24 17:41:04 2017

@author: sfzyk

"""

import matplotlib.pyplot as plt

import numpy as np

import pandas as pd

from sklearn.preprocessing import Imputer

from sklearn.model_selection import train_test_split

from sklearn.metrics import classification_report

from sklearn.neighbors import KNeighborsClassifier

from sklearn.tree import DecisionTreeClassifier

from sklearn.naive_bayes import GaussianNB

import os

def load_dataset(feature_paths,label_paths):

    feature=np.ndarray(shape=(0,41))

    label=np.ndarray(shape=(0,1))

    for file in feature_paths:

        # 使用逗号分隔符读取特征数据，将问号替换标记为缺失值，不包含表头

        df=pd.read_table(file,delimiter=',',na_values='?',header=None)

        imp=Imputer(missing_values='NaN',strategy='mean',axis=0)

        #imp 是一个Imputer实例 用于预处理数据

        imp.fit(df)

        df=imp.transform(df)

        #进行特征合并

        feature=np.concatenate((feature,df))

    for file in label_paths:

        df=pd.read_table(file,header=None)

        label=np.concatenate((label,df))

    label=np.ravel(label)

    return feature,label

if __name__=='__main__':

    os.chdir(r"D:\mechine_learning\mooc_data\bodydata")

    feature_paths=['A.feature','B.feature','C.feature','D.feature','E.feature',]

    #label_paths=['A.label','B.label','C.label']

    #x_train,y_train=load_dataset(feature_paths[:2],label_paths[:2])

    #x_test,y_test=load_dataset(feature_paths[2:],label_paths[2:])

    label_paths=['A.label','B.label','C.label','D.label','E.label',]

    x_train,y_train=load_dataset(feature_paths[:4],label_paths[:4])

    x_test,y_test=load_dataset(feature_paths[4:],label_paths[4:])

    x_train,x_,y_train,y_=train_test_split(x_train,y_train,test_size=0.0)

    '''

    mask=np.random.permutation(x_test.shape[0])[0:10000]

    x_test=x_test[mask,:]

    y_test=y_test[mask]

    x_train,y_train=x_train[0:100000,:],y_train[0:100000]

    '''

    #只是随机打乱

    '''

    print("Start training knn")

    knn=KNeighborsClassifier(algorithm='kd_tree')

    knn.fit(x_train,y_train,)

    print("begin predic")

    answer_knn=knn.predict(x_test)

    print("knn are done")

    print("DT are training")

    DT=DecisionTreeClassifier()

    DT.fit(x_train,y_train)

    print("begin predic")

    answer_DT=DT.predict(x_test)

    print("DT are done")

    print("naive bayes are training")

    nb=GaussianNB()

    nb.fit(x_train,y_train)

    print("begin predic")

    answer_nb=nb.predict(x_test)

    print("naive nb are done!")

    print("knn")

    print(classification_report(y_test,answer_knn))

    print("DT")

    print(classification_report(y_test,answer_DT))

    print("nb")

    print(classification_report(y_test,answer_nb))

    '''

股票涨跌预测###

也是一个效果微乎其微的预测

就算只是预测单天是涨是跌，也只能做到53%左右的准确度。

# -*- coding: utf-8 -*-

"""

Created on Fri May 26 18:59:17 2017

@author: sfzyk

"""

import pandas as pd

import numpy as np

from sklearn import svm

from sklearn import cross_validation

import os

os.chdir("D:\mechine_learning\mooc_data\stock")

data=pd.read_csv("000777.csv",encoding='gbk',parse_dates=[0],index_col=0)

data.sort_index(0,ascending=True,inplace=True)

dayfeature=150

featurenum=5*dayfeature

x=np.zeros((data.shape[0]-dayfeature,featurenum+1))

y=np.zeros((data.shape[0]-dayfeature))

for i in range(0,data.shape[0]-dayfeature):

    x[i,0:featurenum]=np.array(data[i:i+dayfeature][['收盘价','最低价','最高价','开盘价','成交量']]).reshape((1,featurenum))

    x[i,featurenum]=data.ix[i+dayfeature]['开盘价']

for i in range(0,data.shape[0]-dayfeature):

    if data.ix[i+dayfeature]['收盘价']>=data.ix[i+dayfeature]['开盘价']:

        y[i]=1

    else:

        y[i]=0

clf=svm.SVC(kernel='rbf')

result=[]

for i in range(5):

    x_train,x_test,y_train,y_test=cross_validation.train_test_split(x,y,test_size=0.2)

    clf.fit(x_train,y_train)

    result.append(np.mean(y_test==clf.predict(x_test)))

第二周<导学/分类>的更多相关文章

第二周<线性回归>
可行性分析略 sklearn.linear_model.linear_regression() 一些参数 fit_intercept 布尔型参数,表示是否计算该模型的截距 normalize 布尔型 ...
Surprise团队第二周项目总结
Surprise团队第二周项目总结项目进展已实现五子棋人人模式部分人人模式: 基本方式:采取黑棋先行,黑白交替的下棋顺序. 模式:通过鼠标点击相应棋盘中的"交叉点",在lay ...
python课程第二周重点记录
python课程第二周重点记录 1.元组的元素不可被修改,元组的元素的元素可以被修改(字典在元组中,字典的值可以被修改) 2.个人感觉方便做加密解密 3.一些方法的使用 sb = "name ...
20145213《Java程序设计》第二周学习总结
20145213<Java程序设计>第二周学习总结教材学习内容总结本周娄老师给的任务是学习教材的第三章--基础语法.其实我觉得还蛮轻松的,因为在翻开厚重的书本,一股熟悉的气息扑面而来, ...
20145304 刘钦令 Java程序设计第二周学习总结
20145304 <Java程序设计>第2周学习总结教材学习内容总结 java可区分基本类型和类类型(即参考类型)两大类型系统. 基本类型主要可区分为整数.字节.浮点数.字符与布尔. 整 ...
20145330孙文馨《Java程序设计》第二周学习总结
20145330孙文馨第二周学习总结第二周相比于第一周对java语言有了深一点的了解,也意识到多敲代码才是学习计算机语言的最好方法. 教材内容总结类型.变量与运算符 *基本类型整数(short. ...
20145337 《Java程序设计》第二周学习总结
20145337 <Java程序设计>第二周学习总结教材学习内容总结 Java可分基本类型与类类型: 基本类型分整数(short.int.long).字节(byte).浮点数(float ...
Linux内核设计第二周——操作系统工作原理
Linux内核设计第二周 ——操作系统工作原理作者:宋宸宁(20135315) 一.实验过程图1 执行效果从图中可以看出,每执行my_ start_ kernel函数两次或一次,my_ time ...
20169212《Linux内核原理与分析》第二周作业
<Linux内核原理与分析>第二周作业这一周学习了MOOCLinux内核分析的第一讲,计算机是如何工作的?由于本科对相关知识的不熟悉,所以感觉有的知识理解起来了有一定的难度,不过多查查资 ...
20135328信息安全系统设计基础第二周学习总结（vim、gcc、gdb）
第三周学习笔记学习计时:共8小时读书:1 代码:5 作业:1 博客:7 一.学习目标熟悉Linux系统下的开发环境熟悉vi的基本操作熟悉gcc编译器的基本原理熟练使用gcc编译器的常用选项 ...

随机推荐

elasticsearch 中文API facets(⑩)
facets Elasticsearch提供完整的java API用来支持facets.在查询的过程中,将需要计数的facets添加到FacetBuilders中.然后将该FacetBuilders条 ...
(补充)10.Hibernate框架的查询方式
技术分析之Hibernate框架的查询方式 1. 唯一标识OID的检索方式 * session.get(对象.class,OID) 2. 对象的导航的方式 3. HQL的检索方式 * Hibernat ...
Nginx简介与基础配置
何为Nginx? Nginx ("engine x") 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器.最初是为了解决C10k的问题,由Igor ...
微信小程序——简易动画案例
wxml: <view class="container"> <view animation="{{animation}}" class=&q ...
VirtualBox安装CentOS后分辨率和鼠标无缝切换问题
问题:VirtualBox安装完后出现分辨率只有800*600和1024*768,鼠标不能在虚拟机和本机件无缝切换. 解决办法:在终端中执行以下命令 yum install kernel yum in ...
【Redis安装】部署与基本配置 --基于Mac和Linux
Redis安装与部署[基于Mac和Linux] 一.Redis简介基于内存的Key-Value高性能NoSQL数据库二.Redis下载和解压进入官网下载最新版的Redis,目前是5.0.0,这个 ...
转载 Python 安装setuptools和pip工具操作方法(必看)
本文章转载自脚本之家 http://www.jb51.net 感谢! setuptools模块和pip模块是python进行第三方库扩展的极重要工具,例如我们在需要安装一些爬虫或者数据分析的包时就 ...
matlab保存数据
一:存txt文件,用dlmwrite()dlmwrite 将一个矩阵写到由分隔符分割的文件中. 在保存整数到文件时使用save存为ascii文件时,常常是文件里都是实型格式的数据(有小数点,和后面很多 ...
2019-10-11-VisualStudio-配置多进程调试快捷键启动项目
title author date CreateTime categories VisualStudio 配置多进程调试快捷键启动项目 lindexi 2019-10-11 15:33:32 +080 ...
完美解决IE8不支持margin auto问题
不用js,超级简单,完美支持. body下的整个container .container { overflow: hidden; margin: 0px auto; text-align: cente ...