python抓取日本网站上iphone5的价格
抓取日本网站上iphone5的价格,比国内便宜好多
汇率换算是在中国银行的网站上取得 #-*- coding:utf-8 -*-
import requests
import time
from bs4 import BeautifulSoup
import re
def anai(url):
r=requests.get(url)
stats=r.status_code
if stats==200:
body=BeautifulSoup(r.text)
t1=list(body.findAll("p",{"class":"font-14"}))
b = re.compile(r"\d+,\d+")
moneys=[]
for m in t1:
s=str(m)
money=b.findall(s)[0]
money=money.replace(',','')
moneys.append(money)
#print money
return moneys def japHui(url):
r=requests.get(url)
r.encoding='utf-8'
#print r.status_code
#print r.text
stats=r.status_code
if stats==200:
yuan=BeautifulSoup(r.text)
#print str(yuan.table.contents[1])
japItem=yuan.find(text="日元")
huiLv=str(japItem.parent.parent.contents[11])
pattern=re.compile(r"\d\.\d+")
match=pattern.search(huiLv)
if match:
return match.group(0)
else:
return -1 date=time.strftime('%Y-%m-%d',time.localtime(time.time()))
url='http://www.musbi.net/keitai/search.php?com=list&category_id=116107102118102'
moneys=anai(url)
url='http://www.boc.cn/sourcedb/whpj/'
huilv=float(japHui(url))
print u"日期:"+date
print "---------------"
print u"日元汇率:"+str(huilv)
print "---------------"
moneys.sort()
for i in range(len(moneys)):
renMinBi=int(int(moneys[i])*huilv/100)
print "("+'%2s'%str(i+1)+") : "+moneys[i]+u"日元"+" -- "+str(renMinBi)+u'人民币'
python抓取日本网站上iphone5的价格的更多相关文章
- Python抓取花瓣网高清美图
一:前言 嘀嘀嘀,上车请刷卡.昨天看到了不错的图片分享网——花瓣,里面的图片质量还不错,所以利用selenium+xpath我把它的妹子的栏目下爬取了下来,以图片栏目名称给文件夹命名分类保存到电脑中. ...
- Python抓取第一网贷中国网贷理财每日收益率指数
链接:http://www.p2p001.com/licai/index/id/147.html 所需获取数据链接类似于:http://www.p2p001.com/licai/shownews/id ...
- Python爬取前程无忧网站上python的招聘信息
前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 我姓刘却留不住你的心 PS:如有需要Python学习资料的小伙伴可以 ...
- 使用python抓取婚恋网用户数据并用决策树生成自己择偶观
最近在看<机器学习实战>的时候萌生了一个想法,自己去网上爬一些数据按照书上的方法处理一下,不仅可以加深自己对书本的理解,顺便还可以在github拉拉人气.刚好在看决策树这一章,书里面的理论 ...
- 使用python抓取并分析数据—链家网(requests+BeautifulSoup)(转)
本篇文章是使用python抓取数据的第一篇,使用requests+BeautifulSoup的方法对页面进行抓取和数据提取.通过使用requests库对链家网二手房列表页进行抓取,通过Beautifu ...
- Chrome + Python 抓取动态网页内容
用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字.如下所示: import urllib2 url="http: ...
- 关于python抓取google搜索结果的若干问题
关于python抓取google搜索结果的若干问题 前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童 ...
- python爬取当当网的书籍信息并保存到csv文件
python爬取当当网的书籍信息并保存到csv文件 依赖的库: requests #用来获取页面内容 BeautifulSoup #opython3不能安装BeautifulSoup,但可以安装Bea ...
- java网络爬虫----------简单抓取慕课网首页数据
© 版权声明:本文为博主原创文章,转载请注明出处 一.分析 1.目标:抓取慕课网首页推荐课程的名称和描述信息 2.分析:浏览器F12分析得到,推荐课程的名称都放在class="course- ...
随机推荐
- postgresql数据库备份和恢复(超快)
PostgreSQL自带一个客户端pgAdmin,里面有个备份,恢复选项,也能对数据库进行备份 恢复(还原),但最近发现数据库慢慢庞大的时候,经常出错,备份的文件过程中出错的几率那是相当大,手动调节灰 ...
- [ Python - 8 ] 简单demo练习
练习1: 利用os模块编写一个能实现dir -l输出的程序(注意:dir /l是windows下命令) #!_*_coding:utf-8_*_ # Author: hkey import os, t ...
- jQuery中操作样式
操作行间样式 // 获取div的样式 $("div").css("width"); $("div").css("color&quo ...
- Python 进阶 之 @property
@property是一个装饰器,由Python原生库所支持,无需import @property 的作用是将函数变成属性,一般作用于类内的成员函数. 先贴个代码来描述一下@poperty存在的意义: ...
- Python 解释器中方向键无法使用的解决方法
如下: SyntaxError: invalid syntax >>> ^[[A File "<stdin>", line 1 ^ SyntaxErr ...
- 离线安装docker最新版,记得要以下三个包。
如果安装了以前版本,还要删除以下这个包. container-selinux.noarch 2:2.10-2.el7 ============== 离线安装三个rpm -rw-r--r--. 1 ro ...
- React Native - 2 控件Flexbox
*强烈建议使用Genymotion模拟器,比AVD速度快,功能强大. 1. flexDirection Flexbox是连续布局,它有主轴(primary axis)和交叉轴(cross axis ...
- (五)mysql表操作和约束条件
(1)表基本操作 1)创建表 create table 表名(字段 数据类型 约束条件) mysql> create table student1(id int,name varchar(50) ...
- [解决] win7能上网,ubuntu14.04不行
更新驱动 http://www.realtek.com.tw/downloads/downloadsView.aspx?Langid=1&PNid=13&PFid=5&Leve ...
- HDU 6081 度度熊的王国战略【并查集/数据弱水题/正解最小割算法】
链接6081 度度熊的王国战略 Time Limit: 40000/20000 MS (Java/Others) Memory Limit: 32768/132768 K (Java/Others) ...