2019-08-02【机器学习】有监督学习之分类 SVC算法 实例(上证指数跌涨预测)
样本:

代码:有几处与教程不同,自行修改
import pandas as pd
import numpy as np
from sklearn import svm
from sklearn import model_selection #此处与教程不同,模块更改 #1.读取数据,此处不添加 index_col=0 因为会没有最左边的0,1,2,3那一列,导致后续ix换col索引出现问题
data = pd.read_csv('D:\python_source\Machine_study\mooc_data\classification\stock/000777.csv', encoding='gbk', parse_dates=[0])
data.sort_index(0, ascending=True, inplace=True) #按索引列(第一列,日期)升排序 #2.数据预处理
#选取5列数据作为特征:收盘价,最高价,最低价,开盘价,成交量
dayfeature = 150 #选取150天的数据量
featurenum = 5 * dayfeature
'''
data.shape[0] - day.feature意思为要用150天数据做训练,对于条目为200条的数据,只有50条数据
是有前150天的数据来训练的,使用训练集的大小就是200-150,对于每一条数据,它阿特征是前150天的所有特征数据,即150*5,
+1是将当天的开盘价引入作为一条特征数据
'''
x = np.zeros((data.shape[0] - dayfeature, featurenum + 1)) #记录150天的5个特征值
y = np.zeros((data.shape[0]-dayfeature)) #记录涨或者跌 for i in range(0, data.shape[0]-dayfeature):
#将数据中的收盘价,最高价1,开盘价,成交量存入 x数组中
x[i, 0:featurenum] = np.array(data[i:i+dayfeature]\
[[u'收盘价', u'最高价', u'最低价',u'开盘价', u'成交'
u'量']]).reshape((1, featurenum))
x[i, featurenum] = data.loc[i+dayfeature]['开盘价'] #最后一列记录当日开盘价 此处ix已被弃用
#1代表涨,0代表跌
for i in range(0, data.shape[0]-dayfeature):
if data.loc[i+dayfeature]['收盘价']>=data.loc[i+dayfeature]['开盘价']:
y[i] = 1
else:
y[i] = 0 #3.创建SVM并进行交叉验证
clf = svm.SVC(kernel='rbf', gamma='scale') #调用函数,参数默认为rbf,其他:linear,poly,sigmoid
result = []
for i in range(5):
x_train, x_test, y_train, y_test = model_selection.train_test_split(x, y, test_size=0.2)
#x和y的验证集和测试集,切分80-20%的测试集
clf.fit(x_train, y_train)
#训练数据进行训练
result.append(np.mean(y_test == clf.predict((x_test))))
#预测数据和测试集的验证数据进行比对
print("svm classifier accuacy:")
print(result)
结果:


2019-08-02【机器学习】有监督学习之分类 SVC算法 实例(上证指数跌涨预测)的更多相关文章
- 吴裕雄 python 机器学习——支持向量机SVM非线性分类SVC模型
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets, linear_model,svm fr ...
- 2019.08.02 云从科技C++后台开发
公司坐标:重庆 岗位:C++后台开发 面试时长:45分钟 主要问题记录: (1)手写代码 冒泡算法的实现: /** * 冒泡排序:C++ * * @author skywang * @ ...
- 【纪中集训】2019.08.02【NOIP提高组】模拟 A 组TJ
\(\newcommand{\RNum}[1]{\uppercase\expandafter{\romannumeral #1\relax}}\) T1 一道可以暴力撵标算的题-- Descripti ...
- 2019-07-25【机器学习】无监督学习之聚类 K-Means算法实例 (1999年中国居民消费城市分类)
样本 北京,2959.19,730.79,749.41,513.34,467.87,1141.82,478.42,457.64天津,2459.77,495.47,697.33,302.87,284.1 ...
- 机器学习--最邻近规则分类KNN算法
理论学习: 3. 算法详述 3.1 步骤: 为了判断未知实例的类别,以所有已知类别的实例作为参照 选择参数K 计算未知实例与所有已知实例的距离 选 ...
- 2019-07-31【机器学习】无监督学习之聚类 K-Means算法实例 (图像分割)
样本: 代码: import numpy as np import PIL.Image as image from sklearn.cluster import KMeans def loadData ...
- 2019-07-31【机器学习】无监督学习之降维PCA算法实例 (鸢尾花)
样本 代码: import matplotlib.pyplot as plt from sklearn.decomposition import PCA from sklearn.datasets i ...
- 【Todo】【转载】Spark学习 & 机器学习(实战部分)-监督学习、分类与回归
理论原理部分可以看这一篇:http://www.cnblogs.com/charlesblc/p/6109551.html 这里是实战部分.参考了 http://www.cnblogs.com/shi ...
- 02机器学习实战之K近邻算法
第2章 k-近邻算法 KNN 概述 k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法. 一句话总结:近朱者赤近墨者黑! k ...
随机推荐
- thinkphp 前后端分离
thinkphp 前后端分离 简单记录一下之前学习tp的历程吧. 前端HTML页面渲染 <?php namespace app\index\controller; use think\Contr ...
- 贪心-Course Schedule III
2020-02-01 21:37:39 问题描述: 问题求解: 对于课程来说截止时间在前面的肯定需要优先安排,所以首先需要将courses按照deadline进行排序. 然后只需要不断的加入当前的课程 ...
- [BFS,大水题] Codeforces 198B Jumping on Walls
题目:http://codeforces.com/problemset/problem/198/B Jumping on Walls time limit per test 2 seconds mem ...
- 蓝桥杯——一步之遥,扩展gcd的应用
1. 一步之遥 [问题描述]从昏迷中醒来,小明发现自己被关在X星球的废矿车里.矿车停在平直的废弃的轨道上.他的面前是两个按钮,分别写着“F”和“B”. 小明突然记起来,这两个按钮可以控制矿车在轨道上前 ...
- promise的优势
通过不同的方式读取在 files 文件夹下的三个文件来引出 promise 在处理异步时与回调函数相比的优势,files 文件夹有三个文件 a.json,b.json,c.json. // a.jso ...
- sql-lib闯关1-10关
闯关之前我们需要搭建所需环境SQLi-Labs SQLi-Labs是一个专业的SQL注入练习平台,该平台包含了以下在测试场景中常见的注入类型: 1.报错注入(联合查询) 1)字符型 ...
- 5L-链表导论心法
链表是比数组稍微复杂一点的数据结构,也是两个非常重要与基本的数据结构.如果说数组是纪律严明排列整齐的「正规军」那么链表就是灵活多变的「地下党」. 关注公众号 MageByte,有你想要的精彩内容. 链 ...
- 一个完整的机器学习项目在Python中演练(四)
大家往往会选择一本数据科学相关书籍或者完成一门在线课程来学习和掌握机器学习.但是,实际情况往往d是,学完之后反而并不清楚这些技术怎样才能被用在实际的项目流程中.就像你的脑海中已经有了一块块" ...
- 粒子群优化算法(PSO)之基于离散化的特征选择(FS)(三)
作者:Geppetto 前面我们介绍了特征选择(Feature Selection,FS)与离散化数据的重要性,总览的介绍了PSO在FS中的重要性和一些常用的方法,介绍了FS与离散化的背景,介绍本文所 ...
- 扩展KMP(记录学习过程)
首先看了几篇博客,发现还得耐下心来理解,动手画图 ,才能理解俩字符串还有数组之间神奇的关系 这篇博客图不错:https://segmentfault.com/a/1190000008663857 /* ...