2019-08-02【机器学习】有监督学习之分类 SVC算法实例（上证指数跌涨预测）

样本：

代码：有几处与教程不同，自行修改

import pandas as pd

import numpy as np

from sklearn import svm

from sklearn import model_selection #此处与教程不同，模块更改

#1.读取数据，此处不添加 index_col=0 因为会没有最左边的0，1，2，3那一列，导致后续ix换col索引出现问题

data = pd.read_csv('D:\python_source\Machine_study\mooc_data\classification\stock/000777.csv', encoding='gbk', parse_dates=[0])

data.sort_index(0, ascending=True, inplace=True) #按索引列（第一列，日期）升排序

#2.数据预处理

#选取5列数据作为特征：收盘价，最高价，最低价，开盘价，成交量

dayfeature = 150 #选取150天的数据量

featurenum = 5 * dayfeature

'''

data.shape[0] - day.feature意思为要用150天数据做训练，对于条目为200条的数据，只有50条数据

是有前150天的数据来训练的，使用训练集的大小就是200-150，对于每一条数据，它阿特征是前150天的所有特征数据，即150*5，

+1是将当天的开盘价引入作为一条特征数据

'''

x = np.zeros((data.shape[0] - dayfeature, featurenum + 1)) #记录150天的5个特征值

y = np.zeros((data.shape[0]-dayfeature)) #记录涨或者跌

for i in range(0, data.shape[0]-dayfeature):

    #将数据中的收盘价，最高价1，开盘价，成交量存入 x数组中

    x[i, 0:featurenum] = np.array(data[i:i+dayfeature]\

                                  [[u'收盘价', u'最高价', u'最低价',u'开盘价', u'成交'

                                     u'量']]).reshape((1, featurenum))

    x[i, featurenum] = data.loc[i+dayfeature]['开盘价'] #最后一列记录当日开盘价 此处ix已被弃用

#1代表涨，0代表跌

for i in range(0, data.shape[0]-dayfeature):

    if data.loc[i+dayfeature]['收盘价']>=data.loc[i+dayfeature]['开盘价']:

        y[i] = 1

    else:

        y[i] = 0

#3.创建SVM并进行交叉验证

clf = svm.SVC(kernel='rbf', gamma='scale') #调用函数，参数默认为rbf，其他：linear，poly，sigmoid

result = []

for i in range(5):

    x_train, x_test, y_train, y_test = model_selection.train_test_split(x, y, test_size=0.2)

    #x和y的验证集和测试集，切分80-20%的测试集

    clf.fit(x_train, y_train)

    #训练数据进行训练

    result.append(np.mean(y_test == clf.predict((x_test))))

    #预测数据和测试集的验证数据进行比对

print("svm classifier accuacy：")

print(result)

结果：

2019-08-02【机器学习】有监督学习之分类 SVC算法实例（上证指数跌涨预测）的更多相关文章

吴裕雄 python 机器学习——支持向量机SVM非线性分类SVC模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets, linear_model,svm fr ...
2019.08.02 云从科技C++后台开发
公司坐标:重庆岗位:C++后台开发面试时长:45分钟主要问题记录: (1)手写代码冒泡算法的实现: /** * 冒泡排序:C++ * * @author skywang * @ ...
【纪中集训】2019.08.02【NOIP提高组】模拟 A 组TJ
\(\newcommand{\RNum}[1]{\uppercase\expandafter{\romannumeral #1\relax}}\) T1 一道可以暴力撵标算的题-- Descripti ...
2019-07-25【机器学习】无监督学习之聚类 K-Means算法实例（1999年中国居民消费城市分类）
样本北京,2959.19,730.79,749.41,513.34,467.87,1141.82,478.42,457.64天津,2459.77,495.47,697.33,302.87,284.1 ...
机器学习--最邻近规则分类KNN算法
理论学习: 3. 算法详述 3.1 步骤: 为了判断未知实例的类别,以所有已知类别的实例作为参照选择参数K 计算未知实例与所有已知实例的距离选 ...
2019-07-31【机器学习】无监督学习之聚类 K-Means算法实例（图像分割）
样本: 代码: import numpy as np import PIL.Image as image from sklearn.cluster import KMeans def loadData ...
2019-07-31【机器学习】无监督学习之降维PCA算法实例（鸢尾花）
样本代码: import matplotlib.pyplot as plt from sklearn.decomposition import PCA from sklearn.datasets i ...
【Todo】【转载】Spark学习 & 机器学习（实战部分）-监督学习、分类与回归
理论原理部分可以看这一篇:http://www.cnblogs.com/charlesblc/p/6109551.html 这里是实战部分.参考了 http://www.cnblogs.com/shi ...
02机器学习实战之K近邻算法
第2章 k-近邻算法 KNN 概述 k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法. 一句话总结:近朱者赤近墨者黑! k ...

随机推荐

vue后台管理系统权限处理
vue后台管理系统权限 1.权限问题:用户和管理员进入管理系统看到的模块是不一样的,管理员看的的要比用户看到的多.需要用到动态加载路由,router.addRouters()来动态的挂载路由 // 1 ...
Proteomic Profiling of Paired Interstitial Fluids Reveals Dysregulated Pathways and Salivary NID1 as a Biomarker of Oral Cavity Squamous Cell Carcinoma （解读人：张聪敏）
文献名:Proteomic Profiling of Paired Interstitial Fluids Reveals Dysregulated Pathways and Salivary NID ...
ECCV 2018 目标检测 | IoU-Net：将IoU的作用发挥到极致
常见的目标检测算法缺少了定位效果的学习,IoU-Net提出IoU predictor.IoU-guided NMS和Optimization-based bounding box refinement ...
故事：走进JVM的世界（图文并茂）
注意!本文较长,建议先收藏再阅读.更多文章可以关注作者公众号:码上实战你也可以 star 我的 GitHub上本文所属仓库:https://github.com/flyhero/MarkNote 说 ...
ES6的Array.from()和Array.fill()方法
今天处理数据时用到了Array.from()和Array.fill()方法,平时用的不多,这里记一下. 我的需求是要把字符串'abc',处理为[{exaple: 'abc_001.bcd'}, {ex ...
使用toString()检测对象类型
可以通过toString() 来获取每个对象的类型.为了每个对象都能通过 Object.prototype.toString() 来检测,需要以 Function.prototype.call() 或 ...
ubuntu 18.04下virtualbox安装windows虚拟机+增强功能+secureCRT
先强调一下,我是在Ubuntu里安装windows虚拟机,如果要看如何安装linux虚拟机的话,那么你走错地方了. 我一直使用Linux系统做开发的,选择Ubuntu是因为多数常用软件对Ubuntu支 ...
Selenium系列（十） - 针对Select下拉框的操作和源码解读
如果你还想从头学起Selenium,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1680176.html 其次,如果你不懂前端基础知识, ...
Java集合框架要点概括（Core Knowledge of Java Collection）
目录有哪些集合类 Set类 Queue类 List类 Map类 HashMap的实现原理,是否线程安全,如何使其做到线程安全 HashMap的实现原理 HashMap的数据结构 HashMap的存取 ...
读者来信 | 刚搭完HBase集群，Phoenix一启动，HBase就全崩了，是什么原因?（已解决）
前言:之前有朋友加好友与我探讨一些问题,我觉得这些问题倒挺有价值的:于是就想在本公众号开设一个问答专栏,方便技术交流与分享,专栏名就定为:<读者来信>.如遇到本人能力有限难以解决的问题,我 ...

2019-08-02【机器学习】有监督学习之分类 SVC算法 实例（上证指数跌涨预测）

2019-08-02【机器学习】有监督学习之分类 SVC算法 实例（上证指数跌涨预测）的更多相关文章

随机推荐

热门专题

2019-08-02【机器学习】有监督学习之分类 SVC算法实例（上证指数跌涨预测）

2019-08-02【机器学习】有监督学习之分类 SVC算法实例（上证指数跌涨预测）的更多相关文章