Python 学习之urllib模块---用于发送网络请求,获取数据(2)
接着上一次的内容。
先说明一下关于split()方法:它通过指定分隔符对字符串进行切片,如果参数num 有指定值,则仅分隔 num 个子字符串(把一个字符串分割成很多字符串组成的list列表)
语法:str.split(str="", num=string.count(str)).
参数:str 分隔符,默认为空格。num 分割次数
返回值:返回分割后的字符串列表
例如:你需要将一个英语句子中的每一个单词拿出来单独处理,就可以将其进行分割。
如:a=' I am a new student'
a.split()
split会将字符串按照空格进行分割,分割后得到的都是新的字符串,最终返回字符串组成的list
结果['I','am','a','new','student']
其实split()方法和excel里的分隔符很像。
其对应的是连接list的字符串的方法join(),是将list中的所有字符串连接成为一个字符串
如:s=',' lis=['I','am','a','new','student'] result=s.jion(lis) print result 得到结果为 'I,am,a,new,student'
按,连接list
list可以用for...in遍历lis中的元素。 for i in rang(1,10)这里的rang(1,10)就是一个list [1,2,3,4,5,6,7,8,9]
I=rang(1,10)=[1,2,3,4,5,6,7,8,9], for i in I :和 for i in rang(1,10):效果是一样的。
说明一下如何操作list列表
1】访问list中的元素 如上述print lis[0]就会输出'I'
2】修改list中的元素 如修改上述lis,lis[4]='teacher',输出lis时最后一个元素被改成'teacher'
3】list中添加元素 用append方法 如lis.append(2016)
4】删除list元素 用del方法,如del[4]
啊,说了这么多,其实感觉是不是米有啥用,其实这些都是基本知识,今天自己在复习一遍,因为抓取网络上的内容经常是要操作list列表滴。看了这些内容,今天就可以继续学习抓取省/直辖市的编号。
昨天学习的就是如何获取一个网络资源的信息,也就是和文件操作类似,就是打开 ,然后读取,解码,分割成为list列表这几个步骤。可以直接用这个代码
b=urllib.request.urlopen('http://m.weather.com.cn/data5/city.xml').read().decode().spilt(',')
这样就可以得到一个b的列表啦,也就是上述截图print打印出来的内容。分析一下,我们要得到数据01,02,就必须操作这个b列表啦
下面就可以操作这个b列表了,试试
print (b[0]) 看看,是不是打印出'01|北京' ?
继续分析,此时b[0]也是一个字符串,将其按照|分割,就可以得出01啦,所以操作如下,应该是b[0].spilt('|')了,分割出来的数据应该
是[01,'北京’]了,此时再取值:b[0].split('|')[0]?思路是这样,看看是不是?
一个是这样操作,那多个相同的就得循环啦,所以就得用到上述用的for i in list
for i in b: #i=b[0],b[1],b[2]。。。。。。
code=i.split('|')[0]
web='http://m.weather.com.cn/data5/city%s'
web1=web %code
print (web1)
看看是不是能打印出来第二个接口的数据了? 当然如果觉得太多,可以只打出2~3个省的看看。for i in b[:2]
额,有点晚了,明天接着来2016年9月1号
Python 学习之urllib模块---用于发送网络请求,获取数据(2)的更多相关文章
- Python 学习之urllib模块---用于发送网络请求,获取数据
1.urllib urllib是Python标准库的一部分,包含urllib.request,urllib.error,urllib.parse,urlli.robotparser四个子模块. (1) ...
- Python 学习之urllib模块---用于发送网络请求,获取数据(5)
查询城市天气最后一节 需要导入上一节的结果city10.py #!/usr/bin/python# -*- coding: UTF-8 -*-import urllib.requestfrom ci ...
- Python 学习之urllib模块---用于发送网络请求,获取数据(4)
承接将查询城市编码的结果保存到文件中,以字典的形式保存,目的是为了在查询某个城市的天气的时候,能够通过输入的城市名称,找到对应的城市编码.所以此结果字典的数据结构,就是city={城市名称:城市编码} ...
- Python 学习之urllib模块---用于发送网络请求,获取数据(3)
上节内容,是得到了省/直辖市编码,如web='http://m.weather.com.cn/data5/city01',我们需要继续获取此接口的数据,于是进行下面的操作 for i in b ...
- 16 react 发送异步请求获取数据 和 使用Redux-thunk中间件进行 ajax 请求发送
1.发送异步请求获取数据 1.引入 axios ( 使用 yarn add axios 进行安装 ) import axios from 'axios'; 2. 模拟 在元素完成挂载后加载数据 并初始 ...
- 总结:kathasis如何发送get请求获取数据
1.进入前端页面,找到对应的模块,开始塞字段数据. 2.如果字段为基本类型,如String,比如website,则在前段界面,右击,inspect,找到对应的代码所处的jsp,跳转到该jsp,通过该j ...
- python 学习笔记之手把手讲解如何使用原生的 urllib 发送网络请求
urllib.urlopen(url[,data[,proxies]]) : https://docs.python.org/2/library/urllib.html python 中默认自带的网络 ...
- python学习之random模块
Python中的random模块用于生成随机数.下面介绍一下random模块中最常用的几个函数. random.random random.random()用于生成一个0到1的随机符点数: 0 < ...
- Python爬虫之urllib模块2
Python爬虫之urllib模块2 本文来自网友投稿 作者:PG-55,一个待毕业待就业的二流大学生. 看了一下上一节的反馈,有些同学认为这个没什么意义,也有的同学觉得太简单,关于Beautiful ...
随机推荐
- Android Studio 环境配置优化
一.插件 .ignore: 版本控制忽略文件高亮和补齐ADB Idea: ctrl + Shift + A 查找中添加常用卸载安装app的一些操作,无需命令行Android ButterKnife Z ...
- 有n个台阶,如果一次只能上1个或2个台阶,求一共有多少种上法
// n级台阶,求多少种跳法.cpp : Defines the entry point for the console application. // /* 思路: 如果只有一级台阶,n=1,很明显 ...
- JAVA-应用easyui
easyui下载地址:http://www.jeasyui.com/index.php 现在还easyui之后将其解压,解压之后将文件夹中的文件除了demo文件夹之外的文件放入到Eclipse的web ...
- thinkphp实现模糊匹配(学习贵哥代码)
模板文件: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w ...
- socket编程原理
socket编程原理 1.问题的引入 1) 普通的I/O操作过程: UNIX系统的I/O命令集,是从Maltics和早期系统中的命令演变出来的,其模式为打开一读/写一关闭(open-write-rea ...
- WCF - 学习总目录
WCF - 基础 WCF - 地址 WCF - 绑定 WCF - 绑定后续之自定义绑定 WCF - 契约 WCF - 序列化 WCF - 消息 WCF - 实例与会话 WCF - REST服务
- oracle学习----访问路径
什么是访问路径?表扫描数据的时候使用了什么方式,这个方式就是访问路径 1.全表扫描TABLE ACCESS FULL 全表扫描,多块读,等待事件:db file scattered read 如果是并 ...
- 禁止输出重定向(>)覆盖已存在文件(防止误操作)
在输出重定向中,>表示重定向并覆盖已有文件内容,为了防止误操作,覆盖重要的内容,可以使用如下命令: set -C 这样输出重定向到一个已有文件就会提示: cannot overwrite exi ...
- HDU-1114(背包DP)
Piggy-Bank Problem Description Before ACM can do anything, a budget must be prepared and the necessa ...
- dedeCMS修改文章更新发布时间问题
今天在dedeCMS系统中,修改或文章时发现,只要提交以后,文章发布时间便是当前时间.但有时候修改文章以后并不想把文章发布时间也更新成修改时间.我希望的是,修改文章不对时间做更改保持文章原有发布时间, ...