Python爬虫【实战篇】百度翻译
先看代码
import requests
headers = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"}
data = {
    "from":"en",
    "to":"zh",
    "query":"student",
    "transtype":"translang",
    "simple_means_flag":"",
    "sign":"372549.85108",
    "token":"e89a8f037aac1b51a86cbc82356949d"
}
post_url = "http://fanyi.baidu.com/v2transapi"
r = requests.post(post_url,data=data,headers=headers)
print(r.content.decode())
从代码中可以看到,所携带的请求参数比较多,可以尝试切换成手机模式进行请求。
import requests
headers = {
    "User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"
}
data = {
    "query": "学生",
    "from": "zh",
    "to": "en"
}
response = requests.post(url='https://fanyi.baidu.com/basetrans', headers=headers, data=data)
response = response.content.decode('utf-8')
print(type(response))
import json
response = json.loads(response)
print(response.get("trans")[0].get("dst"))
可以很清楚的看到,手机模式所携带的参数比较少,如果我们以后遇到电脑请求携带的参数比较多,可以切换成手机模式来进行请求,会更加容易
现在我们来实现一个终端请求的翻译工具,下面是一次翻译所请求的 ajax 的url

第一个url会返回我们所输入的语言类型

请看代码
# coding=utf-8
import requests
import json
import sys class BaiduFanyi:
def __init__(self, trans_str):
self.trans_str = trans_str
# 这个url获取的结果是我们输入的是中文还是英文
self.lang_detect_url = "https://fanyi.baidu.com/langdetect"
self.trans_url = "https://fanyi.baidu.com/basetrans"
self.headers = {
"User-Agent": "Mozilla/5.0 (Linux; Android 5.1.1; Nexus 6 Build/LYZ28E) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Mobile Safari/537.36"} def parse_url(self, url, data): # 发送post请求,获取响应
response = requests.post(url, data=data, headers=self.headers)
# print(json.loads(response.content.decode()))
return json.loads(response.content.decode()) def get_ret(self, dict_response): # 提取翻译的结果
ret = dict_response["trans"][0]["dst"]
print("result is :", ret) def run(self): # 实现主要逻辑
# 1.获取语言类型
# 1.1 准备post的url地址,post_data
lang_detect_data = {"query": self.trans_str}
# 1.2 发送post请求,获取响应
lang = self.parse_url(self.lang_detect_url, lang_detect_data)["lan"]
# 1.3 提取语言类型
# 2.准备post的数据
trans_data = {"query": self.trans_str, "from": "zh", "to": "en"} if lang == "zh" else \
{"query": self.trans_str, "from": "en", "to": "zh"}
# 3.发送请求,获取响应
dict_response = self.parse_url(self.trans_url, trans_data)
# 4.提取翻译的结果
self.get_ret(dict_response) if __name__ == '__main__':
trans_str = sys.argv[1]
baidu_fanyi = BaiduFanyi(trans_str)
baidu_fanyi.run()
终端输入 python baidufanyi.py 学生 就可以得到结果。
Python爬虫【实战篇】百度翻译的更多相关文章
- Python爬虫教程-实现百度翻译
		使用python爬虫实现百度翻译功能python爬虫实现百度翻译: python解释器[模拟浏览器],发送[post请求],传入待[翻译的内容]作为参数,获取[百度翻译的结果] 通过开发者工具,获取发 ... 
- Python爬虫爬取百度翻译之数据提取方法json
		工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统 说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的 ... 
- Python 爬虫实战2 百度贴吧帖子
		爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标 对百度贴吧的任意帖子进行抓取 指定是否只抓取楼主发帖内容 将抓取到的内容分析并保存到文件 1.URL格式的确定 首先, ... 
- python爬虫实战2百度贴吧爬html
		转自:http://blog.csdn.net/wxg694175346/article/details/8927832 import string, urllib2 #定义百度函数 def baid ... 
- python --爬虫--爬取百度翻译
		import requestsimport json class baidufanyi: def __init__(self, trans_str): self.lang_detect_url = ' ... 
- 《精通Python网络爬虫》|百度网盘免费下载|Python爬虫实战
		<精通Python网络爬虫>|百度网盘免费下载|Python爬虫实战 提取码:7wr5 内容简介 为什么写这本书 网络爬虫其实很早就出现了,最开始网络爬虫主要应用在各种搜索引擎中.在搜索引 ... 
- Python爬虫实战二之爬取百度贴吧帖子
		大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 前言 亲爱的们,教程比较旧了,百度贴吧页面可能改版,可能代码不 ... 
- 转 Python爬虫实战二之爬取百度贴吧帖子
		静觅 » Python爬虫实战二之爬取百度贴吧帖子 大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标 ... 
- Python爬虫实战之爬取百度贴吧帖子
		大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标 对百度贴吧的任意帖子进行抓取 指定是否只抓取楼主发帖 ... 
- Python爬虫实战---抓取图书馆借阅信息
		Python爬虫实战---抓取图书馆借阅信息 原创作品,引用请表明出处:Python爬虫实战---抓取图书馆借阅信息 前段时间在图书馆借了很多书,借得多了就容易忘记每本书的应还日期,老是担心自己会违约 ... 
随机推荐
- qt 布局
			说到qt布局,比起之前用的MFC好了许多,而且qt支持qss,可以更好的美化界面.qt提供了几种常见的布局管理 窗体布局,这对客户端程序来说是一个福音,再也不用操心程序界面放大缩小时界面控件怎么变化, ... 
- JAVA内存分配与回收策略
			对象的内存分配,大方向上讲,就是在堆上分配,对象主要分配在新生代的Eden区上,如果启动了本地线程分配缓冲,将按线程优先在TLAB上分配.少数情况下也可能会直接分配在老年代中,分配规则并不是百分百固定 ... 
- Android总结篇系列:Activity启动模式(lauchMode)
			本来想针对Activity中的启动模式写篇文章的,后来网上发现有人已经总结的相当好了,在此直接引用过来,并加上自己的一些理解,在此感谢原作者. 文章地址: http://blog.csdn.net/l ... 
- 设计模式总结篇系列:外观模式(Facade)
			张三自从毕业后开始做软件开发,做着做着发现不爽了,钱赚不了太多,头发也白了.于是拿着一点小资本,想着做点小生意.瞅着眼前的餐饮行业还不错,于是打算开一家餐馆.开参观可不是一件容易的事,仅仅行政类的审批 ... 
- 监控mysql
			Mysql服务器监控 管理MySql服务器属于应用程序监控范畴.这是因为绝大多数性能参数是有MySql软件产生的,而不属于主操作系统的一部分. 如当前所提到的,应该总是先监控基础操作系统,然后监控My ... 
- Linux常用监控命令简介 - top
			top -hv | -bcisS -d delay -n iterations -p pid [, pid ...] 指令介绍-b : 批次模式运行.-c : 显示执行任务的命令行.-d : 设定延迟 ... 
- 对多字段进行去重 ( Linq 方式 )
			优质参考资料:http://www.cnblogs.com/A_ming/archive/2013/05/24/3097062.html 
- 从零开始学安全(三十五)●mysql  盲注手工自定义python脚本
			import requests import string #mysql 手动注入 通用脚本 适用盲注 可以跟具自己的需求更改 def home(): url="url" list ... 
- Java开发笔记(六十二)如何定义函数式接口
			前面介绍了Lambda表达式的用法,从实践中发现它确实极大地方便了开发者,然而不管是匿名内部类还是Lambda表达式,所举的例子都离不开各类数组的排序方法,倘使Lambda表达式仅能用于sort方法, ... 
- 解决Windows下栈内存过小的问题
			本地是windows环境 这个需要对你的IDE进行更改 拿Dev-C++来说 加入一条编译命令就好 -Wl,--stack= 评测机是Windows环境 很简单 在你的代码前面加一行 #pragma ... 
