json数据爬虫。requests实现

get请求

import json

import requests

# url = "https://www.mamalaile.cn/mamalailegw/page/waiterList.jsp"

url = "https://www.mamalaile.cn/momcome-app/waiter/api_queryUserWaiterInfo.do"

headers = {

    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'

}

response = requests.get(url, headers=headers)

data_str = response.content.decode()

data_dict = json.loads(data_str)

print(type(data_dict))

print(len(data_dict['data']))

print(data_dict['data'][0]['name'])

i = 0

for item in data_dict['data']:

    i += 1

    print(str(i))

    print('姓名：%s'%item['name'])

    print('年龄：%s'%item['age'])

    print('籍贯：%s'%item['place'])

    print('属相：%s'%item['animals'])

post传参

import json

import requests

url = "http://www.duoxiwa.com/nlh/io/mon/queryMonList.htm"

headers = {

    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'

}

data_form={

    'pageSize':'1000',

    'currPage':'1'

}

response = requests.post(url, headers=headers,data=data_form)

data_str = response.content.decode()

data_dict = json.loads(data_str)

print(type(data_dict))

print(len(data_dict['data']))

# print(data_dict['data'])

# print(data_dict['data'][0]['name'])

i = 0

for item in data_dict['data']:

    i += 1

    print(str(i))

    print('姓名：%s' % item['name'])

    print('年龄：%s' % item['age'])

    print('籍贯：%s' % item['placeDesc'])

    print('属相：%s' % item['animal'])

json数据爬虫。requests实现的更多相关文章

python发起post请求获取json数据使用requests方法
最普通的答案我一直就觉得GET和POST没有什么除了语义之外的区别,自打我开始学习Web编程开始就是这么理解的 . 可能很多人都已经猜到了答案是: 1.GET 使用URL或Cookie传参.而POS ...
requests post一个json数据
# post一个json数据 import requests headers={ "Accept":"application/json, text/plain, */*& ...
爬虫-requests
一.爬虫系列之第1章-requests模块爬虫简介概述近年来,随着网络应用的逐渐扩展和深入,如何高效的获取网上数据成为了无数公司和个人的追求,在大数据时代,谁掌握了更多的数据,谁就可以获得更高的 ...
爬虫——requests模块
一爬虫简介 #1.什么是互联网? 互联网是由网络设备(网线,路由器,交换机,防火墙等等)和一台台计算机连接而成,像一张网一样. #2.互联网建立的目的? 互联网的核心价值在于数据的共享/传递:数据是 ...
2 爬虫 requests模块
requests模块 Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库,Requests它会比urllib更加方便,reques ...
爬虫3 requests之json 把json数据转化为字典
#json 将json数据转化为字典,方便操作数据 res = requests.get('http://httpbin.org/get') print(res.json()) #res.json() ...
python爬虫中涉及json数据的处理
在执行爬虫项目的过程中,有时返回的不是一个html页面而是json格式数据,此时对数据的解析非常重要. 1.Json格式数据的爬取采用request对以上的url进行爬取: import re ...
04 Python网络爬虫 <<爬取get/post请求的页面数据>>之requests模块
一. urllib库 urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求.其常被用到的子模块在Python3中的为urllib.request和urllib ...
[开源 .NET 跨平台数据采集爬虫框架: DotnetSpider] [四] JSON数据解析
[DotnetSpider 系列目录] 一.初衷与架构设计二.基本使用三.配置式爬虫四.JSON数据解析与配置系统场景模拟假设由于漏存JD SKU对应的店铺信息.这时我们需要重新完全采集所有 ...

随机推荐

Android学习之Handler消息
Android系统规定,一些耗时的操作不能放在UI线程中去执行,这样会报一个ANR错误.所以为了避免该问题,我们需要开启一个新的线程去执行一些耗时操作:开启新的线程,将耗时的操作在新线程里面去执行, ...
URL域名获取
http://"是协议名 "www.test.com"是域名 "是端口号 "aaa"是站点名 "bbb.aspx"是页面 ...
boost::noncopyable介绍
http://blog.csdn.net/huang_xw/article/details/8248960# boost::noncopyable比较简单, 主要用于单例的情况.通常情况下, 要写一个 ...
Undeclared identifier:XXX
未识别错误,是因拼写错误或找不到定义文件. 下面列举一些类型和函数用到的单元. _Stream ADODB_TLB akTop, akLeft, akRight, akBottom Controls ...
Qt获取CPU编号和硬盘序列号
windows下执行命令除了用cmd之外,还有个东西叫WMIC,非常强大,可以通过他获取很多信息,包括硬件信息. QString frmMain::getWMIC(const QString & ...
使用Struts时，JSP中如何取得各个会话中的参数值？
· request <s:property value="#request.req"/> 或者 ${requestScope.req} · session <s: ...
Ubuntu Eclipse配置Python开发环境
一在Eclipse中安装pydev插件启动Eclipse, 点击Help->Install New Software... 在弹出的对话框中,点Add 按钮. Name中填:Pydev Lo ...
Android 源码下载，国内镜像
AOSP(Android) 镜像使用帮助 https://lug.ustc.edu.cn/wiki/mirrors/help/aosp 首先下载 repo 工具. mkdir ~/bin PATH=~ ...
SQL Server2008 R2 安装失败后的解决办法
当你第一次安装SQL Server2005,SQL Server2008,SQL Server2012失败后,第二次重新安装一般还是容易安装失败,原因就是你没有完全卸载,还存留残留文件和注册表. 我安 ...
Office2010安装需要MSXML版本6.10.1129.0的方法
今天给朋友装Office2010,由于朋友之前使用的是绿化版的0ffice2007,所以卸载后安装Office遇到了若要安装Office2010,需要在计算机上安装MSXML版本6.10.1129.0 ...

json数据爬虫。requests实现

json数据爬虫。requests实现的更多相关文章

随机推荐

热门专题