用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库

 #该脚本可以提取沪深两市上市公司股票信息，并按以下信息分类：（1）当天股价创近10个交易日新高的股票；（2）停牌的股票；（3）复牌不超过一个交易日或者新发行的股票

 #将分类后的股票及其信息（股价新高、当前状态等）存入mysql数据库

 from time import *

 import pandas as pd

 import tushare as ts

 from datetime import date

 import datetime

 import MySQLdb

 import sys

 reload(sys)

 sys.setdefaultencoding('utf8')        #将编码方式默认改为utf-8

 #-------------------------------定义函数：计算当天往前推Deltadays个交易日所对应的日期--------------------------

 def com_StartDate(Deltadays):

     i=0

     da=date.today()

     while i!=Deltadays:

         da=da-datetime.timedelta(days=1)

         if da.isoweekday()==6 or da.isoweekday()==7:   #判断当前日期是否为周末（此处未考虑法定节假日，后续改进）

             pass

         else:

             i+=1

     return da.strftime("%Y-%m-%d")   #返回值数据类型为string

 #--------------定义函数：判断某支股票处于什么状态，并返回股票代码、名字和股价（对于创新高的股票）等信息--------

 def stock_info(stockID,startdate,index):

     today=date.today()

     df=ts.get_hist_data(stockID,start=startdate,end=today.strftime("%Y-%m-%d")) #获取股票信息

     if type(df)!=type(None) and len(df.index)>1:                       #抓取时间周期内，有数据天数低于2天的，算作新股

         df=df.reindex(index=index,method='ffill',fill_value=int(-1))

         period_high=df['high'].max()

         today_high=df.ix[today.strftime("%Y-%m-%d")]['high']

         if today_high>=period_high and today_high>0 :

             stock_status=int(0)         #非新股，未停牌，股价创新高

             return stock_status,df

         elif today_high==int(-1):

             stock_status=int(1)        #非新股，但停牌

             return stock_status,df

         else:

             stock_status=int(2)       #非新股，未停牌，股价未创新高

             return stock_status,df

     else:

         stock_status=int(3)           #新股或复牌不超过1天的股票

         return stock_status,df

 #-----------------------------------------------获取沪深两市所有 上市公司基本信息---------------------------

 all_stocks_info=ts.get_stock_basics()

 Deltadays=10

 startdate=com_StartDate(Deltadays)

 newRecStocksID=[]                    #股票价格创新高的股票代码列表

 newRecStocksPrice=[]                 #创新高的股票价格列表

 newRecStocksName=[]                  #股票价格创新高的股票名称列表

 suspendedStocksID=[]                #停牌股票代码列表

 suspendedStocksName=[]              #停牌股票名称列表

 newORresumeStocksID=[]                      #新发行或者当天复牌的股票代码列表

 newORresumeStocksName=[]                    #新发行或者当天复牌的股票名称列表

 today=date.today()

 index=ts.get_hist_data('',start=startdate,end=today.strftime("%Y-%m-%d"),retry_count=10,pause=1).index

 for i in all_stocks_info.index:

     stock_status,stockinfo=stock_info(str(i), startdate,index)

     if  stock_status==int(0):                                #当日股价创Deltadays天内新高的股票

         newRecStocksID.append(str(i).zfill(6))

         newRecStocksName.append(all_stocks_info.ix[str(i),'name'])

         newRecStocksPrice.append(stockinfo.ix[today.strftime("%Y-%m-%d"),'high'])

     elif stock_status==int(1):                              #已停牌的股票

         suspendedStocksID.append(str(i).zfill(6))

         suspendedStocksName.append(all_stocks_info.ix[str(i), 'name'])

     elif stock_status==int(2):                             #未停牌，且股价未创Deltadays天内新高的股票

         pass

     else:                                                  #该股票为新发行或者复牌不超过一天的股票

         newORresumeStocksID.append(str(i).zfill(6))

         newORresumeStocksName.append(all_stocks_info.ix[str(i), 'name'])

 #-------------------------------------------数据写入DataFrame----------------------------------------------

 newRecStocks=pd.DataFrame({'stockID':newRecStocksID,'stockname':newRecStocksName,'high_price':newRecStocksPrice,'status':['NewRecord']*len(newRecStocksID)})

 suspendedStocks=pd.DataFrame({'stockID':suspendedStocksID,'stockname':suspendedStocksName,'status':['Suspended']*len(suspendedStocksID)})

 newORresumeStocks=pd.DataFrame({'stockID':newORresumeStocksID,'stockname':newORresumeStocksName,'status':['New or Resume']*len(newORresumeStocksID)})

 #-----------------------------------将数据存入MySQL数据库，数据库名称：stocks------------------------------

 db=MySQLdb.connect('localhost','root','','stocks',charset='utf8')

 pd.io.sql.to_sql(frame=newRecStocks,con=db,name=today.strftime("%Y%m%d")+'newRecordStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)

 pd.io.sql.to_sql(frame=suspendedStocks,con=db,name=today.strftime("%Y%m%d")+'suspendedStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)

 pd.io.sql.to_sql(frame=newORresumeStocks,con=db,name=today.strftime("%Y%m%d")+'newORresumeStocks',flavor='mysql',schema=None,if_exists='replace',index=True,index_label=None,chunksize=1000,dtype=None)

 db.commit()

 db.close()

用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库的更多相关文章

Python+Scrapy+Crawlspider 爬取数据且存入MySQL数据库
1.Scrapy使用流程 1-1.使用Terminal终端创建工程,输入指令:scrapy startproject ProName 1-2.进入工程目录:cd ProName 1-3.创建爬虫文件( ...
python爬虫学习(2)__抓取糗百段子，与存入mysql数据库
import pymysql import requests from bs4 import BeautifulSoup#pymysql链接数据库 conn=pymysql.connect(host= ...
python爬取疫情数据存入MySQL数据库
import requests from bs4 import BeautifulSoup import json import time from pymysql import * def mes( ...
Statement和PreparedStatement的特点 MySQL数据库分页存取大对象批处理获取数据库主键值
1 Statement和PreparedStatement的特点 a)对于创建和删除表或数据库,我们可以使用executeUpdate(),该方法返回0,表示未影向表中任何记录 b)对于创建和 ...
python爬虫：爬取易迅网价格信息，并写入Mysql数据库
本程序涉及以下方面知识: 1.python链接mysql数据库:http://www.cnblogs.com/miranda-tang/p/5523431.html 2.爬取中文网站以及各种乱码处 ...
Python爬虫教程-25-数据提取-BeautifulSoup4（三）
Python爬虫教程-25-数据提取-BeautifulSoup4(三) 本篇介绍 BeautifulSoup 中的 css 选择器 css 选择器使用 soup.select 返回一个列表通过标 ...
Python爬虫教程-23-数据提取-BeautifulSoup4（一）
Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据,查看文档 https://www.crummy.com/software/BeautifulSoup/bs4/doc. ...
Python 获取 exe 的 icon 并且保存
Python 获取 exe 的 icon 并且保存参考链接:https://mail.python.org/pipermail/python-win32/2009-April/009078.html ...
使用shell/python获取hostname/fqdn释疑
一直以来被Linux的hostname和fqdn(Fully Qualified Domain Name)困惑了好久,今天专门抽时间把它们的使用细节弄清了. 一.设置hostname/fqdn 在Li ...

随机推荐

git clone --early EOF
出现这个问题可能需要重新检查以下方面: 1. Android studio Git 的安装地址: ..../Git/cmd/git.exe 记得在环境变量 --Path 中进行配置: ,..../G ...
opencv vs环境配置
1.新建环境变量 OPENCV = D:\Programss\opencv\build 2.%OPENCV%\x86\vc12\bin;加入Path环境变量 3.导入 VS属性表文件 cv2413.p ...
swift_属性观察者
//: Playground - noun: a place where people can play import Cocoa var str = "Hello, playground& ...
LoadRunner脚本参数化设置
LoadRunner,是一种预测系统行为和性能的负载测试工具,其中VUG(Virtual User Generator)主要用于虚拟用户生成和脚本编辑.为了实现单用户多次迭代执行脚本,VUG提供了强大 ...
MySQL JDBC/MyBatis Stream方式读取SELECT超大结果集
情景: 遍历并处理一个大表中的所有数据, 这个表中的数据可能会是千万条或者上亿条, 很多人可能会说用分页limit……但需求本身一次性遍历更加方便, 且Oracle/DB2都有方便的游标机制. 对DB ...
即时聊天IM之四 Android客户端IM帮助类编写
图文无关一起娱乐: 这一篇我们开始写Android端的Smack版主类,后面Android的IM功能都是通过这个帮助类实现的引用类库: 因为我用的是IDE是Android Studio,所以我通过g ...
iPhone5停留在语音的界面，提示按三次home键，无法继续下去
不知道之前用户是怎么操作的,可能是刷机或恢复出厂设置.穷人,没用玩过iPhone. 根据提示关键词,网上搜索,发现只需要按三次home,三次锁屏,三次锁屏,最后再三次home就可以了. 试了两次,还真 ...
archlinux 安装手记
Wiki常用软件 https://wiki.archlinux.org/index.php/Common_Applications -> 移动硬盘等的自动挂载 pacman -S gvfs-af ...
b/s 猫大叔
好复杂,要把客户端文件传到服务端,再从服务端传到FTP......肿么设计的这是.... 至少你都要把客户端的文件读到服务端的内存中,因为B/S控制器在S端,不在B端非要用B/S实 ...
C# winform中读取HTML代码
这次的任务是在winform建立一个表格,表格第一列需要绑定数据,表格的第一行也需要绑定数据,而其他的单元格数据则是根据对应的行数据和列数据进行提取. 询问过后,需要在后台拼接HTML代码实现这个功能 ...

用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库

用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库的更多相关文章

随机推荐

热门专题