Python爬虫【实战篇】百度翻译

先看代码

import requests

headers = {

    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"}

data = {

    "from":"en",

    "to":"zh",

    "query":"student",

    "transtype":"translang",

    "simple_means_flag":"",

    "sign":"372549.85108",

    "token":"e89a8f037aac1b51a86cbc82356949d"

}

post_url = "http://fanyi.baidu.com/v2transapi"

r = requests.post(post_url,data=data,headers=headers)

print(r.content.decode())

从代码中可以看到，所携带的请求参数比较多，可以尝试切换成手机模式进行请求。

import requests

headers = {

    "User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"

}

data = {

    "query": "学生",

    "from": "zh",

    "to": "en"

}

response = requests.post(url='https://fanyi.baidu.com/basetrans', headers=headers, data=data)

response = response.content.decode('utf-8')

print(type(response))

import json

response = json.loads(response)

print(response.get("trans")[0].get("dst"))

可以很清楚的看到，手机模式所携带的参数比较少，如果我们以后遇到电脑请求携带的参数比较多，可以切换成手机模式来进行请求，会更加容易

现在我们来实现一个终端请求的翻译工具，下面是一次翻译所请求的 ajax 的url

第一个url会返回我们所输入的语言类型

请看代码

# coding=utf-8

import requests

import json

import sys

class BaiduFanyi:

    def __init__(self, trans_str):

        self.trans_str = trans_str

        # 这个url获取的结果是我们输入的是中文还是英文

        self.lang_detect_url = "https://fanyi.baidu.com/langdetect"

        self.trans_url = "https://fanyi.baidu.com/basetrans"

        self.headers = {

            "User-Agent": "Mozilla/5.0 (Linux; Android 5.1.1; Nexus 6 Build/LYZ28E) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Mobile Safari/537.36"}

    def parse_url(self, url, data):  # 发送post请求，获取响应

        response = requests.post(url, data=data, headers=self.headers)

        # print(json.loads(response.content.decode()))

        return json.loads(response.content.decode())

    def get_ret(self, dict_response):  # 提取翻译的结果

        ret = dict_response["trans"][0]["dst"]

        print("result is :", ret)

    def run(self):  # 实现主要逻辑

        # 1.获取语言类型

        # 1.1 准备post的url地址，post_data

        lang_detect_data = {"query": self.trans_str}

        # 1.2 发送post请求，获取响应

        lang = self.parse_url(self.lang_detect_url, lang_detect_data)["lan"]

        # 1.3 提取语言类型

        # 2.准备post的数据

        trans_data = {"query": self.trans_str, "from": "zh", "to": "en"} if lang == "zh" else \

            {"query": self.trans_str, "from": "en", "to": "zh"}

        # 3.发送请求，获取响应

        dict_response = self.parse_url(self.trans_url, trans_data)

        # 4.提取翻译的结果

        self.get_ret(dict_response)

if __name__ == '__main__':

    trans_str = sys.argv[1]

    baidu_fanyi = BaiduFanyi(trans_str)

    baidu_fanyi.run()

终端输入 python baidufanyi.py 学生就可以得到结果。

Python爬虫【实战篇】百度翻译的更多相关文章

Python爬虫教程-实现百度翻译
使用python爬虫实现百度翻译功能python爬虫实现百度翻译: python解释器[模拟浏览器],发送[post请求],传入待[翻译的内容]作为参数,获取[百度翻译的结果] 通过开发者工具,获取发 ...
Python爬虫爬取百度翻译之数据提取方法json
工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的 ...
Python 爬虫实战2 百度贴吧帖子
爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标对百度贴吧的任意帖子进行抓取指定是否只抓取楼主发帖内容将抓取到的内容分析并保存到文件 1.URL格式的确定首先, ...
python爬虫实战2百度贴吧爬html
转自:http://blog.csdn.net/wxg694175346/article/details/8927832 import string, urllib2 #定义百度函数 def baid ...
python --爬虫--爬取百度翻译
import requestsimport json class baidufanyi: def __init__(self, trans_str): self.lang_detect_url = ' ...
《精通Python网络爬虫》|百度网盘免费下载|Python爬虫实战
<精通Python网络爬虫>|百度网盘免费下载|Python爬虫实战提取码:7wr5 内容简介为什么写这本书网络爬虫其实很早就出现了,最开始网络爬虫主要应用在各种搜索引擎中.在搜索引 ...
Python爬虫实战二之爬取百度贴吧帖子
大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 前言亲爱的们,教程比较旧了,百度贴吧页面可能改版,可能代码不 ...
转 Python爬虫实战二之爬取百度贴吧帖子
静觅 » Python爬虫实战二之爬取百度贴吧帖子大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标 ...
Python爬虫实战之爬取百度贴吧帖子
大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子.与上一篇不同的是,这次我们需要用到文件的相关操作. 本篇目标对百度贴吧的任意帖子进行抓取指定是否只抓取楼主发帖 ...
Python爬虫实战---抓取图书馆借阅信息
Python爬虫实战---抓取图书馆借阅信息原创作品,引用请表明出处:Python爬虫实战---抓取图书馆借阅信息前段时间在图书馆借了很多书,借得多了就容易忘记每本书的应还日期,老是担心自己会违约 ...

随机推荐

arrays.xml中使用integer-array引用drawable图片资源，代码中如何将这些图片资源赋值到ImageView控件中
当我们在arrays.xml文件中声明一些图片资源数组的时候: <?xml version="1.0" encoding="utf-8"?> < ...
Solr 07 - Solr从MySQL数据库中导入数据 (Solr DIH的使用示例)
目录 1 加入数据导入处理器的jar包 2 加入数据库驱动包 3 配置solrconfig.xml文件 3.1 配置lib标签 - 加入驱动jar包 3.2 配置requestHandler标签 - ...
Linux~Sh脚本一点自己的总结
从.netCore开源项目来看,eShopOnContainers来说,它的部署是跨平台的,可以部署在linux,docker上,在linux上运行它也可以写一些集成的小脚本,这是微信工程师为我们提供 ...
C++STL模板库序列容器之deque
目录一丶队列容器deque简介二丶使用代码演示一丶队列容器deque简介 deque底层跟vector一样,都是数组维护.不同的是可以操作头部. 二丶使用代码演示 #define _CRT_SE ...
babel版本兼容报错处理：Plugin/Preset files are not allowed to export objects
原文地址: https://www.cnblogs.com/jiebba/p/9618930.html 1.为什么会报错 ? 这里抱着错误是因为 babel 的版本冲突. 多是因为你的 babel 依 ...
Python判断相等
判断相等方法有好几个:== .is . isinstance .issubclass .operator 模块. == :两个对象内容是否相等. >>> a = [22,44]> ...
Java开发笔记（十八）上下求索的while循环
循环是流程控制的又一重要结构,“白天-黑夜-白天-黑夜”属于时间上的循环,古人“年复一年.日复一日”的“日出而作.日落而息”便是每天周而复始的生活.计算机程序处理循环结构时,给定一段每次都要执行的代码 ...
Java开发笔记（六十八）从泛型方法探究泛型的起源
前面介绍各种容器之时,通过在容器名称后面添加包裹数据类型的一对尖括号,表示该容器存放的是哪种类型的元素.这样一来总算把Java当中的各类括号都凑齐了,例如包裹一段代码的花括号.指定数组元素下标的方括号 ...
Elasticsearch必备技能之索引迁移
将ES中的索引拷贝到其他ES中,是不是很重要呢? 长话短说,推荐一个工具: 一.elasticsearch-dump 安装: #yum install epel-release #yum instal ...
【代码笔记】Web-CSS-CSS Table(表格）
一,效果图. 二,代码. <!DOCTYPE html> <html> <head> <meta charset="utf-8"> ...

Python爬虫【实战篇】百度翻译

Python爬虫【实战篇】百度翻译的更多相关文章

随机推荐

热门专题