Python基于皮尔逊系数实现股票预测

 # -*- coding: utf-8 -*-

 """

 Created on Mon Dec  2 14:49:59 2018

 @author: zhen

 """

 import matplotlib.pyplot as plt

 import numpy as np

 import pandas as pd

 from datetime import datetime

 def normal(a):  #最大值最小值归一化

     return (a - np.min(a)) / (np.max(a) - np.min(a)+0.000001)

 def normalization(x): # np.std:计算矩阵的标准差（方差的算术平方根）

     return (x - np.mean(x)) / np.std(x)

 def corrcoef(a,b):

     corrc = np.corrcoef(a,b) # 计算皮尔逊相关系数，用于度量两个变量之间的相关性，其值介于-1到1之间

     corrc = corrc[0,1]

     return (16 * ((1 - corrc) / (1 + corrc)) ** 1) # ** 表示乘方

 startTimeStamp = datetime.now() # 获取当前时间

 # 加载数据

 filename = 'C:/Users/zhen/.spyder-py3/sh000300_2017.csv'

 # 获取第一，二列的数据

 all_date = pd.read_csv(filename,usecols=[0, 1, 3], dtype = 'str')

 all_date = np.array(all_date)

 data = all_date[:, 0]

 times = all_date[:, 1]

 data_points = pd.read_csv(filename,usecols=[3])

 data_points = np.array(data_points)

 data_points = data_points[:,0] #数据

 topk = 10 #只显示top-10

 baselen = 100

 basebegin = 361

 basedata = data[basebegin]+' '+times[basebegin]+'~'+data[basebegin+baselen-1]+' '+times[basebegin+baselen-1]

 base = data_points[basebegin:basebegin+baselen]#一天的数据是240个点

 length = len(data_points) #数据长度

 # 分割片段

 subseries = []

 dateseries = []

 for j in range(0,length):

     if (j < (basebegin - baselen) or j > (basebegin + baselen - 1)) and j <length - baselen:

         subseries.append(data_points[j:j+baselen])

         dateseries.append(j) #开始位置

 # 片段搜索

 listdistance = []

 for i in range(0, len(subseries)):

     tt = np.array(subseries[i])

     distance = corrcoef(base, tt)

     listdistance.append(distance)

 # 排序

 index = np.argsort(listdistance,kind='quicksort') #排序，返回排序后的索引序列

 # 显示，要匹配的数据

 plt.figure(0)

 plt.plot((base),label = basedata, linewidth='')

 plt.legend(loc='upper left')

 plt.title('Base data')

 # 原始数据

 plt.figure(1)

 num = index[0]

 length = len(subseries[num])

 begin = data[dateseries[num]]+' '+times[dateseries[num]]

 end = data[dateseries[num]+length-1]+' '+times[dateseries[num]+length-1]

 label = begin+'~'+end

 plt.plot((subseries[num]), label=label, linewidth='')

 plt.legend(loc='upper left')

 plt.title('Similarity data')

 # 结果集对比

 plt.figure(2)

 plt.plot(normalization(base),label= basedata,linewidth='')

 length = len(subseries[num])

 begin = data[dateseries[num]] + ' ' + times[dateseries[num]]

 end = data[dateseries[num] + length - 1] + ' ' + times[dateseries[num] + length - 1]

 label = begin + '~' + end

 plt.plot(normalization(subseries[num]), label=label, linewidth='')

 plt.legend(loc='lower right')

 plt.title('normal similarity search')

 plt.show()

 endTimeStamp=datetime.now()

 print('run time', (endTimeStamp-startTimeStamp).seconds, "s")

结果：

Python基于皮尔逊系数实现股票预测的更多相关文章

从欧几里得距离、向量、皮尔逊系数到http://guessthecorrelation.com/
一.欧几里得距离就是向量的距离公式二.皮尔逊相关系数反应的就是线性相关游戏http://guessthecorrelation.com/ 的秘诀也就是判断一组点的拟合线的斜率y/x ------- ...
皮尔逊相似度计算的例子(R语言)
编译最近的协同过滤算法皮尔逊相似度计算.下顺便研究R简单使用的语言.概率统计知识. 一.概率论和统计学概念复习 1)期望值(Expected Value) 由于这里每一个数都是等概率的.所以就当做是数 ...
Pearson(皮尔逊)相关系数及MATLAB实现
转自:http://blog.csdn.net/wsywl/article/details/5727327 由于使用的统计相关系数比较频繁,所以这里就利用几篇文章简单介绍一下这些系数. 相关系数:考察 ...
pandas通过皮尔逊积矩线性相关系数（Pearson's r）计算数据相关性
皮尔逊积矩线性相关系数(Pearson's r)用于计算两组数组之间是否有线性关联,举个例子: a = pd.Series([1,2,3,4,5,6,7,8,9,10]) b = pd.Series( ...
Pearson（皮尔逊）相关系数
Pearson(皮尔逊)相关系数:也叫pearson积差相关系数.衡量两个连续变量之间的线性相关程度. 当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数, ...
皮尔逊（Pearson）系数矩阵——numpy
一.原理注意专有名词.(例如:极高相关) 二.代码 import numpy as np f = open('../file/Pearson.csv', encoding='utf-8') dat ...
np.corrcoef()方法计算数据皮尔逊积矩相关系数（Pearson's r）
上一篇通过公式自己写了一个计算两组数据的皮尔逊积矩相关系数(Pearson's r)的方法,但np已经提供了一个用于计算皮尔逊积矩相关系数(Pearson's r)的方法 np.corrcoef() ...
皮尔逊残差 | Pearson residual
参考:Pearson Residuals 这些概念到底是写什么?怎么产生的? 统计学功力太弱了!
Spark Mllib里的如何对两组数据用皮尔逊计算相关系数
不多说,直接上干货! import org.apache.spark.mllib.stat.Statistics 具体,见 Spark Mllib机器学习实战的第4章 Mllib基本数据类型和Mlli ...

随机推荐

mysql 开发基础系列8 表的存储引擎
一. 表的存储引擎 1. 概述插件式存储引擎是mysql数据库最重要的特性之一, 用户可以根据应用的需要选择如何存储和索引数据,是否使用事务等.在mysql 5.0里支持的引擎包括: MyISAM, ...
Struts2体系介绍
回顾Struts2,在会用基础上重看的理解. Struts 2框架架构流程一个请求在Struts 2框架中的处理大概分为以下几个步骤. (1) 客户端提交一个HttpServletRequest请求 ...
【EF6学习笔记】（二）操练 CRUD 增删改查
本篇原文链接: Implementing Basic CRUD Functionality 说明:学习笔记参考原文中的流程,为了增加实际操作性,并能够深入理解,部分地方根据实际情况做了一些调整:并且根 ...
权限控制和OAuth
目录 1 权限控制是什么 1.1 ACL 1.2 RBAC 1.2.1 名词术语 1.2.2 RBAC定义 1.2.3 RBAC分类 1.2.3.1 RBAC0 1.2.3.2 RBAC1 1.2.3 ...
win32程序之窗口程序,以及消息机制
win32程序值窗口程序,以及消息机制一丶简介通过上一讲.我们了解了窗口其实是绘制出来的.而且是不断绘制的过程. 所以窗口的本质是绘制. 但是我们现在看到的窗口程序.都可以点击关闭按钮. 使用鼠标 ...
[总结] wqs二分学习笔记
论文提出问题在某些题目中,强制规定只能选 \(k\) 个物品,选多少个和怎么选都会影响收益,问最优答案. 算法思想对于上述描述的题目,大部分都可以通过枚举选择物品的个数做到 \(O(nk^2)\ ...
Perl数据序列化和持久化(入门)：Storable模块
Perl提供了一个Storable模块,用来对数据结构进行序列化(serialization,Perl中称为冻结),也就是将数据结构保存为二进制数据. 序列化后的数据可以写入文件实现持久化,可以将持久 ...
Layui table 组件的使用：初始化加载数据、数据刷新表格、传参数
背景笔者之前一直使用 bootstrap table ,因为当前项目中主要使用 Layui 框架,于是也就随了 Layui table ,只是在使用的时候出现了一些问题,当然也是怪自己不熟悉的锅吧! ...
frp 初探
条件: (1) 服务器端要有公网 IP (2) 客户端能上网,能够访问服务器的公网 IP 下载 https://github.com/fatedier/frp/releases 根据服务器和客户端的操 ...
php中的implements 使用详解
php类中接口的应用关键字是interface.implements了,接口是一种成员属性全部为抽象或常量的特殊抽象类,implements主要是对类名,类所拥有的方法,以及所传参数起约束和规范做用, ...

Python基于皮尔逊系数实现股票预测

Python基于皮尔逊系数实现股票预测的更多相关文章

随机推荐

热门专题