年初学习量化投资,一开始想自己从头写,还是受了C/C++的影响.结果困在了计算回测数据那里,结果老也不对,就暂时放下了.最近试了一下python的各个量化投资框架,发现一个能用的——pyalgotrade,重新开始吧.这是一个事件驱动型量化交易框架. 使用pyalgotrade的一大问题是数据获取,其支持从yahoo,谷歌等途径获得数据,但要获取A股数据比较麻烦.还是用tushare获取数据比较方便.但pyalgotrade并不直接支持tushare数据格式.网上有人介绍了将tushare数据转…
看<量化投资:以python为工具>这本书,第一部分是python的基础知识.这一部分略读了,只看我还不知道或不熟的. 定义复数 x = complex(2, 5) #2+5j 也可以直接定义 y = 3-6j 用id()可以得到变量的内存地址 python z = 3-6j print(id(y), id(z))python y和z的内存地址是一样的. 531269809744 531269809744 python可以为不可变对象分配固定的内存,减少内存占用. 当两个变量指向同一对象时,i…
作者: 阿布 阿布量化版权所有 未经允许 禁止转载 abu量化系统github地址(欢迎+star) 本节ipython notebook 之前的小节回测示例都是使用美股,本节示例A股市场的回测. 买入因子,卖出因子等依然使用相同的设置,如下所示: # 设置初始资金数 read_cash = 1000000 # 买入因子依然延用向上突破因子 buy_factors = [{'xd': 60, 'class': AbuFactorBuyBreak}, {'xd': 42, 'class': Abu…
北京理工大学在线课程: http://www.icourse163.org/course/BIT-1001872001 机器学习分类 监督学习 无监督学习 半监督学习 强化学习 深度学习 Scikit-learn算法分类 sklearn自带的标准数据集 sklearn的六大任务:分类.回归.聚类.降维.模型选择.数据预处理. 一.无监督学习:数据没有标签.最常用的是聚类和降维. 聚类:根据数据的相似性将数据分为多类的过程.使用样本的"距离"来估算样本的相似性,不同的距离计算方法有不同的…
聚类的实际应用,图像分割. 利用图像的特征将图像分割为多个不相重叠的区域. 常用的方法有阈值分割,边缘分割,直方图法,特定理论(基于聚类,小波分析等). 实例:利用k-means聚类算法对图像像素点颜色进行聚类以分割图像. 输出:同一聚类的点以相同颜色表示,不同聚类的像素点以不同的颜色表示. 用PIL库从图片中读取像素点的颜色,转化到[0,1]的范围内. f = open(filePath, "rb") data = [] img = image.open(f) m,n = img.s…
有监督学习 常用分类算法 KNN:K近邻分类器.通过计算待分类数据点,与已知数据中所有点的距离,取距离最小的前K个点,根据"少数服从多数"的原则,将这个数据点划分为出现次数最多的那个类别. 在sklearn中,使用sklearn.neighbors.KNeighborsClassifier创建K邻近分类器. 选取较大K值,可以减小误差,但可能导致预测错误.选取k值较小,易引起过拟合.一般倾向于选择较小的k值,并使用交叉验证法选取最优的k值. 决策树算法 是一种树形结构分类器,通过顺序询…
用分类算法进行上证指数涨跌预测. 根据今天以前的150个交易日的数据,预测今日股市涨跌. 交叉验证的思想:将数据集D划分为k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层抽样来得到.然后,每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集.这样可以获得k组训练/测试集,从而可进行k次训练/测试,最终返回的是这k个测试结果的均值.通常称为"k者交叉验证",常用取值是10. coding:utf-8 用分类算法预测股市涨跌 import pandas…
岭回归 解决某些训练样本线性相关,导致回归结果不稳定的情况. 它是一种用于共线性数据分析的有偏估计回归方法.是一种改良的最小二乘估计法. 在sklearn中使用sklearn.linear_model.Ridge进行. 课程的实例是交通流量预测,我找不到数据文件,从网上自己找个例子吧. 用波士顿房价预测做例子. 先加载数据并放到dataframe里. 用seaborn的pairplot画图看看. 真不错,又会一招.可以看到(最后一行或最后一列)有的属性与房价有明显的关系,而有的没有明显关系. 还…
用KNN算法来进行数字识别,还是用sklearn自带的digits数据集. coding:utf-8 KNN算法实现手写识别 from sklearn import neighbors from sklearn.datasets import load_digits from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report import matplo…
loadrunner学习笔记-01事务<转载至网络> 事务又称为Transaction,事务是一个点为了衡量某个action的性能,需要在开始和结束位置插入一个范围,定义这样一个事务. 作用:LoadRunner运行到该事务的开始点时,LoadRunner就会开始计时,直到运行到该事务的结束点,计时结束.这个事务的运行时间在LoadRunner的运行结果中会有反映.通俗的讲LoadRunner中的事务就是一个计时标识,LoadRunner在运行过程中一旦发现事务的开始标识,就开始计时,一旦发现…