使用python爬虫实现百度翻译功能
python爬虫实现百度翻译： python解释器【模拟浏览器】，发送【post请求】，传入待【翻译的内容】作为参数，获取【百度翻译的结果】

通过开发者工具，获取发送请求的地址

提示：翻译内容发送的请求地址，绝对不是打开百度翻译的那个地址，想要抓取地址，就要借助【浏览器的开发者工具】，或者其他抓包工具

下面介绍获取请求地址的具体方法
以Chrome为例

打开百度翻译：http://fanyi.baidu.com/
【点击右键】>【检查】>【network】（如果是火狐浏览器，点击【网络】）
点击【XHR】项，（有些需要刷新，有些异步的请求不需要刷新）
在页面【输入翻译的词汇】
在XHR项下，查找包含【输入需要翻译的词汇】的请求
查看请求的参数，需要【点击请求】>【Headers】>最下面的【Form Data】
（这里有一个坑：我们会发现有多个sug项，其实是因为百度翻译只要每输入一个字母就会发送一次请求，所以虽然多个请求的地址都是一样的，但是只有最后一个sug项的参数才是最后的词汇）

操作截图 :

请求地址在这里

献上实现的代码

直接上代码，具体步骤下载注释上了

不会配置环境，安装python的包，请参考下一篇：
https://i-beta.cnblogs.com/posts/edit-done;postId=11945465
py05bdfanyi.py文件：https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py05bdfanyi.py

 # python爬虫实现百度翻译

 # urllib和request POST参数提交

 # 缺少包请自行查看之前的笔记

 from urllib import request,parse

 import json

 def fanyi(keyword):

     base_url = 'http://fanyi.baidu.com/sug'

     # 构建请求对象

     data = {

         'kw': keyword

     }

     data = parse.urlencode(data)

     # 模拟浏览器

     header = {"User-Agent": "mozilla/4.0 (compatible; MSIE 5.5; Windows NT)"}

     req = request.Request(url=base_url,data=bytes(data,encoding='utf-8'),headers=header)

     res = request.urlopen(req)

     # 获取响应的json字符串

     str_json = res.read().decode('utf-8')

     # 把json转换成字典

     myjson = json.loads(str_json)

     info = myjson['data'][0]['v']

     print(info)

 if __name__=='__main__':

     while True:

         keyword = input('请输入翻译的单词：')

         if keyword == 'q':

             break

         fanyi(keyword)

代码运行

如果还有问题未能得到解决，搜索887934385交流群，进入后下载资料工具安装包等。最后，感谢观看！

Python爬虫教程-实现百度翻译的更多相关文章

Python爬虫爬取百度翻译之数据提取方法json
工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的 ...
python --爬虫--爬取百度翻译
import requestsimport json class baidufanyi: def __init__(self, trans_str): self.lang_detect_url = ' ...
Python爬虫教程-08-post介绍(百度翻译)（下）
Python爬虫教程-08-post介绍(下) 为了更多的设置请求信息,单纯的通过urlopen已经不太能满足需求,此时需要使用request.Request类构造Request 实例 req = ...
Python爬虫教程-07-post介绍(百度翻译)（上）
Python爬虫教程-07-post介绍(百度翻译)(上) 访问网络两种方法 get: 利用参数给服务器传递信息参数为dict,使用parse编码 post :(今天给大家介绍的post) 一般向服 ...
Python爬虫教程-06-爬虫实现百度翻译(requests)
使用python爬虫实现百度翻译(requests) python爬虫上一篇介绍了怎么使用浏览器的[开发者工具]获取请求的[地址.状态.参数]以及使用python爬虫实现百度翻译功能[urllib] ...
Python爬虫教程-16-破解js加密实例（有道在线翻译）
python爬虫教程-16-破解js加密实例(有道在线翻译) 在爬虫爬取网站的时候,经常遇到一些反爬虫技术,比如: 加cookie,身份验证UserAgent 图形验证,还有很难破解的滑动验证 js签 ...
Python爬虫教程-01-爬虫介绍
Spider-01-爬虫介绍 Python 爬虫的知识量不是特别大,但是需要不停和网页打交道,每个网页情况都有所差异,所以对应变能力有些要求爬虫准备工作参考资料精通Python爬虫框架Scrap ...
Python爬虫教程-00-写在前面
鉴于好多人想学Python爬虫,缺没有简单易学的教程,我将在CSDN和大家分享Python爬虫的学习笔记,不定期更新基础要求 Python 基础知识 Python 的基础知识,大家可以去菜鸟教程进行 ...
简单的python爬虫教程：批量爬取图片
python编程语言,可以说是新型语言,也是这两年来发展比较快的一种语言,而且不管是少儿还是成年人都可以学习这个新型编程语言,今天南京小码王python培训机构变为大家分享了一个python爬虫教程. ...

随机推荐

CSS 学习手册
目录 CSS 简介 1.CSS 简介 CSS 概述层叠次序 2.CSS 基础语法 CSS 语法值的不同写法和单位记得写引号多重声明: 空格和大小写 3.CSS 高级语法选择器的分组继承及其 ...
diango创建一个app
创建一个app terminal里执行命令 python manage.py startapp app名称注册 settings配置 INSTALLED_APPS = [ 'app01', 'app ...
表单生成器(Form Builder)之mongodb表单数据查询——关联查询
这一篇接着记录一下查询相关的操作.想象一下,如果想要在一张表格中展示某些车辆的耗损和营收情况,我们该怎么处理.车辆.耗损.营收各自存储在一张表中,耗损和营收中冗余了车辆信息……我们便想到了关联查询.m ...
生产环境Shell脚本Ping监控主机是否存活（多种方法）
在网上针对shell脚本ping监控主机是否存活的文档很多,但大多都是ping一次就决定了状态,误报率会很高,为了精确判断,ping三次不通再发告警,只要一次ping通则正常.于是,今天中午抽出点时间 ...
关于spring boot上手的一点介绍
在spring官网网址 https://spring.io/guides 下,有许多相关介绍,包括可以构建的例子程序. 使用intellij idea,可以通过新建 spring boot initi ...
springboot+quartz+数据库存储
Spring整合Quartz a.quartz调度框架是有内置表的进入quartz的官网http://www.quartz-scheduler.org/,点击Downloads, 下载后在目录\do ...
selenium-server-standalone下载网站
http://selenium-release.storage.googleapis.com/index.html
（day69）axios、配置ElementUI、配置jQuery和Bootstrap、Django中的CORS问题
目录一.Vue的ajax插件:axios 二.Django中的CORS跨域问题 (一)同源策略 (二)解决方式(cors模块) 三.Vue配置ElementUI 四.Vue配置jQuery和Boot ...
java之工厂方法设计模式
工厂方法模式是设计模式中应用最广泛的模式.在面向对象的编程中,对象的创建工作非常简单,对象的创建时机却很重要.工厂方法模式就是解决这个问题,它通过面向对象的手法,将所要创建的具体对象创建工作延迟到了子 ...
安装PS
1:下载溜云库 2:查找PS软件,下载 3:按照教程安装