Python股票信息抓取(二)

在一的基础上，想着把所有的折线图放在一个图中，然后图的结果如图所示：

不是略丑，是很丑~

依然的单进程，只是将图标结果放在了一张图里

代码如下：

#-*-coding:utf-8 -*-

import urllib

import re

import json

import urllib2

from lxml import etree

import requests

import time

from Queue import Queue

import matplotlib.pyplot as plt

URL = 'http://quote.fx678.com/exchange/WH'

nation_que = Queue()

nation = Queue()

high = Queue()

start_time = Queue()

Chart = []

def download(url, headers, num_try=2):

    while num_try >0:

        num_try -= 1

        try:

            content = requests.get(url, headers=headers)

            return content.text

        except urllib2.URLError as e:

            print 'Download error', e.reason

    return None

def sub_sort(array,array1,low,high):

    key = array[low]

    key1 = array1[low]

    while low < high:

        while low < high and array[high] >= key:

            high -= 1

        while low < high and array[high] < key:

            array[low] = array[high]

            array1[low] = array1[high]

            low += 1

            array[high] = array[low]

            array1[high] = array1[low]

    array[low] = key

    array1[low] = key1

    return low

def quick_sort(array,array1,low,high):

     if low < high:

        key_index = sub_sort(array,array1,low,high)

        quick_sort(array,array1,low,key_index)

        quick_sort(array,array1,key_index+1,high)

def get_type_url():

    headers = {

        'User_agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',

        'Referer': 'http://quote.fx678.com/exchange/WH',

        'Cookie': 'io=-voMclEjiizK9nWKALqB; UM_distinctid=15f5938ddc72db-089cf9ba58d9e5-31657c00-fa000-15f5938ddc8b24; Hm_lvt_d25bd1db5bca2537d34deae7edca67d3=1509030420; Hm_lpvt_d25bd1db5bca2537d34deae7edca67d3=1509031023',

        'Accept-Language': 'zh-CN,zh;q=0.8',

        'Accept-Encoding': 'gzip, deflate',

        'Accept': '*/*'

    }

    content = download(URL,headers)

    html = etree.HTML(content)

    result = html.xpath('//a[@class="mar_name"]/@href')

    for each in result:

        print each

        st = each.split('/')

        nation_que.put(st[len(st)-1])

    get_precent()

def get_precent():

    while not nation_que.empty():

        ss = nation_que.get(False)

        print ss

        url = 'http://api.q.fx678.com/history.php?symbol=' + ss +'&limit=288&resolution=5&codeType=8100&st=0.8274405615006541'

        print url

        headers = {'Accept':'application/json, text/javascript, */*; q=0.01',

                'Accept-Encoding':'gzip, deflate',

                'Accept-Language':'zh-CN,zh;q=0.8',

                'Connection':'keep-alive',

                'Host':'api.q.fx678.com',

                'Origin':'http://quote.fx678.com',

                'Referer':'http://quote.fx678.com/symbol/USD',

                'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36'

               }

        num_try = 2

        while num_try >0:

            num_try -= 1

            try:

                content = requests.get(url, headers=headers)

                html = json.loads(content.text)

                st = html['h']

                T_time = html['t']

                if  len(st) > 0 and len(T_time) > 0:

                    draw_pict(T_time,st)

                break

            except urllib2.URLError as e:

                print 'Download error', e.reason

        nation_que.task_done()

List = []

def draw_pict(T_time1,high_rate):

    print T_time1

    print high_rate

    num = 0

    High = T_time1

    Time = high_rate

    High_Rate = []

    num = 0

    T_time = []

    for each,high1 in zip(T_time1,high_rate):

        st = time.localtime(float(each))

        if st.tm_min == 0:

            T_time.append(st.tm_hour)

            High_Rate.append(high1)

        else:

            pass

    if len(T_time) == len(High_Rate):

        quick_sort(T_time,High_Rate,0,len(High_Rate)-1)

        List.append(High_Rate)

def draw_picture():

    colu = len(List)

    num = 1

    for each in List:

        plt.subplot(colu/2 + 1,2,num)

        num+=1

        list = each

        T_time = []

        for i in range(len(list)):

            T_time.append(i)

        print len(list)

        print len(T_time)

        plt.plot(T_time, list, marker='*')

    plt.show()

    plt.title('Share Message')

if __name__ == '__main__':

    get_type_url()

    draw_picture()

折线图结果如图

ps:1的是将图的结果进行单个显示，每支股票是单独的一张图

Python股票信息抓取(二)的更多相关文章

Python股票信息抓取(三)
最近在看mongodb,然后会用了一些最简单的mongodb的操作,然后想着结合股票信息的数据的抓取,然后将数据存储在mongodb中,对于mongo和数据库的最大的区别是,mongo不需要建表,直接 ...
Python股票信息抓取~
本来想把股票的涨跌抓取出来,用汇通网的股票为例,就找了国际外汇为例. 页面里有xhr请求,并且每个xhr的url请求的 http://api.q.fx678.com/history.php?symbo ...
python requests抓取NBA球员数据，pandas进行数据分析，echarts进行可视化 (前言)
python requests抓取NBA球员数据,pandas进行数据分析,echarts进行可视化 (前言) 感觉要总结总结了,希望这次能写个系列文章分享分享心得,和大神们交流交流,提升提升. 因为 ...
Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储
Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...
python Web抓取（一）[没写完]
需要的模块: python web抓取通过: webbrowser:是python自带的,打开浏览器获取指定页面 requests:从因特网上下载文件和网页 Beautiful Soup:解析HTML ...
Python数据抓取技术与实战 pdf
Python数据抓取技术与实战目录 D11章Python基础1.1Python安装1.2安装pip1.3如何查看帮助1.4D1一个实例1.5文件操作1.6循环1.7异常1.8元组1.9列表1.10字 ...
python 爬虫抓取心得
quanwei9958 转自 python 爬虫抓取心得分享 urllib.quote('要编码的字符串') 如果你要在url请求里面放入中文,对相应的中文进行编码的话,可以用: urllib.quo ...
python数据抓取分析（python + mongodb）
分享点干货!!! Python数据抓取分析编程模块:requests,lxml,pymongo,time,BeautifulSoup 首先获取所有产品的分类网址: def step(): try: ...
python 处理抓取网页乱码
python 处理抓取网页乱码问题一招鲜相信用python的人一定在抓取网页时,被编码问题弄晕过一阵前几天写了一个测试网页的小脚本,并查找是否包含指定的信息. 在html = urllib2. ...

随机推荐

Unity3D for VR 学习(3): 暴风魔镜PC Input小改造–自己动手、丰衣足食
在做手游的时候,80%时间是在PC调试的,例如业务逻辑.AI算法.核心玩法等. 拿到魔镜提供的demo,晕了,必须得安装到Android机器上,才能调试,究其原因,有三: 需要用到手机陀螺仪需要用到 ...
Linux内核设计与实现第四周读书笔记
第5章系统调用 5.1与内核通信主要作用: 为用户控件提供了一种硬件的抽象接口. 保证了系统稳定性与安全性. 为用户空间&系统提供公共接口. 5.2API.POSIX和C库一般情况,应用程 ...
代码收藏系列--jquery--筛选器、事件绑定技巧
Jquery筛选器的一些常用技巧,比如过滤属性等 /* 过滤获取没有含data-xsui-grid-colspan的节点 */$(this).find('.xsui-grid-cell:not([da ...
bzoj4753: [Jsoi2016]最佳团体（分数规划+树形依赖背包）
菜菜推荐的“水题”虐了我一天T T...(菜菜好强强qwq~ 显然是个分数规划题,二分答案算出p[i]-mid*s[i]之后在树上跑依赖背包,选k个最大值如果>0说明还有更优解. 第一次接触树形 ...
【DP】【CF855C】 Helga Hufflepuff's Cup
Description 给你一个树,可以染 $m$ 个颜色,定义一个特殊颜色 $k$ , 要求保证整棵树上特殊颜色的个数不超过 $x$ 个.同时,如果一个节点是特殊颜色,那么它的相邻节点的 ...
The 14th Zhejiang Provincial Collegiate Programming Contest Sponsored by TuSimple - F 贪心+二分
Heap Partition Time Limit: 2 Seconds Memory Limit: 65536 KB Special Judge A sequence S = { ...
TC规则
633人阅读 TC规则涉及到队列(QUEUE) 分类器(CLASS) 过滤器(FILTER),filter划分的标志位可用U32或iptables的set-mark来实现 ) 一般是" ...
[大数据可视化]-saiku的源码打包运行/二次开发构建
Saiku构建好之后,会将项目的各个模块达成jar包,整个项目也会打成war包 saiku目录结构: 我们选中saiku-server/target/ 下面的zip压缩包.这是个打包后的文件,进行 ...
Oracle用imp导入dmp 提示遇到 ORACLE 错误 12560 TNS: 协议适配器错误解决方法
用imp命令导入dmp文件时提示以下错误: IMP-00058: 遇到 ORACLE 错误 12560 : ORA-12560: TNS: 协议适配器错误 : IMP-00000: 未成功终止导入 : ...
⑦ 设计模式的艺术-13.代理（Proxy）模式
为什么需要代理模式中介隔离作用:在某些情况下,一个客户类不想或者不能直接引用一个委托对象,而代理类对象可以在客户类和委托对象之间起到中介的作用,其特征是代理类和委托类实现相同的接口. 开闭原则,增加 ...

Python股票信息抓取(二)

Python股票信息抓取(二)的更多相关文章

随机推荐

热门专题