python爬虫学习---爬取微软必应翻译（中英互译）

前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者：OSinooO

本人属于python新手，刚学习的 python爬虫基础迫不及待地想试一试，看了论坛里大佬们写的在线翻译爬虫程序，想着自己把它写出来，以下是我爬微软翻译的过程，作为笔记记录下来：

1.获取信息

要实现在线翻译过程，首先要获得目标网站的信息，我们先打开微软必应翻译的官网（https://cn.bing.com/translator）：

我们需要获得它的翻译请求和响应信息，操作如下：

（1）右键“检查”（用的Google Chrome浏览器），进入这个界面：

也可以通过右上角》更多工具》开发者工具进入。

（2）选择“Network”

（3）输入我们想翻译的内容，先输入“hello”，选择简体中文：

可以看到右边出了很多抓到的包，点开看一下。

（4）找到response（响应）里面出现了翻译结果的包

（5）接下来就是获取URL和data信息了，在“Headers”部分就可以看到。这里的URL是处理我们请求翻译的网页地址，当网页请求方式为POST时，请求参数存放在data（类型为字典）里。

URL：https://cn.bing.com/ttranslate?&category=&IG=C4A52C35D175427988E6510779DEFB5F&IID=translator.5036.8

这里我要说明一下，我在第一次找URL的时候找到的是这个：

https://cn.bing.com/ttranslate?&category=&IG=7E72C4A882064F48BAD8D7C06B7F22A9&IID=translator.5036.1

用这个URL也可以翻译，但是只能翻译单个单词和词语，在后面的代码中如果翻译了长句子就会报错。所以提取参数的时候可以把翻译内容多写一点，找到能长句翻译的URL。

data：｛‘text’:'hello', 'from':'en', 'to':'zh-CHS'｝这里用字典形式写出来，简单解读就是'text'是翻译的内容，'from'是翻译内容的语言，这里的'en'就代表英语，'to'是翻译结果的语言，'zh-CHS'代表简体中文。这些之后要用到。

2.代码构建

得到信息之后就可以开始写代码了，具体可以参考文章开头的两篇参考博文，这里直接给出代码：如果你看不懂的话，建议先去小编的Python交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,多跟里面的人交流，进步更快哦！

import requests

url = 'https://cn.bing.com/ttranslate?&category=&IG=C4A52C35D175427988E6510779DEFB5F&IID=translator.5036.8'

def translate_weiruan(info,fr='zh-CHS',to="en"):

    print('翻译结果：'+requests.post(url,data={'text':info,'from':fr,'to':to,'doctype':'json'}).json()['translationResponse'])

def is_Chinese(str):       #判断输入的内容是否是中文

    for ch in str:

        if '\u4e00' <= ch <= '\u9fff':

            return True

        else:

            return False

def start_translate():

    trans = input('翻译内容：')

    if is_Chinese(trans):        #实现自动判断，中英互译

        translate_weiruan(trans)

    else:

        translate_weiruan(trans,fr='en',to='zh-CHS')

if __name__ == '__main__':

    print('          翻译结果由微软翻译提供！（请确保网络已连接）')

    while True:

        start_translate()

        print('\n')

这里用的requests模块，可以用一句话实现我们的功能，具体参考文章开头的第二篇博文。

再简单解释一下：

def translate_weiruan(info,fr='zh-CHS',to="en"):

    print('翻译结果：'+requests.post(url,data={'text':info,'from':fr,'to':to,'doctype':'json'}).json()['translationResponse'])

这段代码的功能就是用POST方式连接翻译网站（url）并给它传参数（data），返回一个 json 类型的信息，再用 json（）方法对信息进行处理。返回的信息如下：

很简单的字典类型：{"statusCode":200,"translationResponse":"你好"｝

再用关键字"translationResponse"提取翻译结果。

3.实战结果

OK，也算是初步完成功能啦！当然里面也还是有很多不足，还请各位大牛指点。如果你也正在学习，可以去如果你看不懂的话，建议先去小编的Python交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,多跟里面的人交流，进步更快哦！

python爬虫学习---爬取微软必应翻译（中英互译）的更多相关文章

python爬虫学习-爬取某个网站上的所有图片
最近简单地看了下python爬虫的视频.便自己尝试写了下爬虫操作,计划的是把某一个网站上的美女图全给爬下来,不过经过计算,查不多有好几百G的样子,还是算了.就首先下载一点点先看看. 本次爬虫使用的是p ...
Python爬虫之爬取淘女郎照片示例详解
这篇文章主要介绍了Python爬虫之爬取淘女郎照片示例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧本篇目标抓取淘宝MM ...
Python爬虫之爬取慕课网课程评分
BS是什么? BeautifulSoup是一个基于标签的文本解析工具.可以根据标签提取想要的内容,很适合处理html和xml这类语言文本.如果你希望了解更多关于BS的介绍和用法,请看Beautiful ...
python爬虫实战---爬取大众点评评论
python爬虫实战—爬取大众点评评论(加密字体) 1.首先打开一个店铺找到评论很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经 ...
[Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上)
转载自:http://blog.csdn.net/eastmount/article/details/51231852 一. 文章介绍源码下载地址:http://download.csdn.net/ ...
from appium import webdriver 使用python爬虫,批量爬取抖音app视频（requests+Fiddler+appium）
使用python爬虫,批量爬取抖音app视频(requests+Fiddler+appium) - 北平吴彦祖 - 博客园 https://www.cnblogs.com/stevenshushu/p ...
Python爬虫之爬取站内所有图片
title date tags layut Python爬虫之爬取站内所有图片 2018-10-07 Python post 目标是 http://www.5442.com/meinv/ 如需在非li ...
python爬虫项目-爬取雪球网金融数据（关注、持续更新）
(一)python金融数据爬虫项目爬取目标:雪球网(起始url:https://xueqiu.com/hq#exchange=CN&firstName=1&secondName=1_ ...
python爬虫之爬取糗事百科并将爬取内容保存至Excel中
本篇博文为使用python爬虫爬取糗事百科content并将爬取内容存入excel中保存·. 实验环境:Windows10 代码编辑工具:pycharm 使用selenium(自动化测试工具)+p ...

随机推荐

014.Kubernetes二进制部署docker
一部署docker 1.1 部署docker组件 docker 运行和管理容器,kubelet 通过 Container Runtime Interface (CRI) 与它进行交互. 1.2 下载 ...
Jenkins + docker ，容器中跑docker服务
1. 宿主机:安装docker 2. 启动jenkins服务 https://jenkins.io/download/ Jenkins官网找自己需要的镜像版本号进行使用. docker run -it ...
hdu 1233 (prim，最小生成树) 还是畅通工程
还是畅通工程Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submi ...
MySQL/MariaDB读写分离配置
DB读写分离描述数据库的读写分离其实就是为了加减少数据库的压力:数据库的写入操作由主数据库来进行,读取操作由从数据库来进行操作.实现数据库读写分离技术是有很多方法的,在这里我就用一个比较简单的mys ...
Grid表格的js触发事件
没怎么接触过Grid插件: 解决的问题是:点击Grid表行里的内容触发js方法弹出模态框,用以显示选中内容的详细信息. 思路:给准备要触发的列加上一个css属性,通过这个css属性来获取元素并触发js ...
移动端vue项目的图片上传插件
有一移动端项目,使用的vant-ui.可是vant自带的Uploader似乎不支持一次选择多张图片上传的功能. 于是乎:在https://www.npmjs.com/查找发现找到 vue-upload ...
面向对象之classmethod和staticmethod(python内置装饰器)
对象的绑定方法复习classmethodstaticmethod TOC 对象的绑定方法复习由对象来调用会将对象当做第一个参数传入若对象的绑定方法中还有其他参数,会一并传入 classmetho ...
2019-10-8：渗透测试，基础学习,php基础，会话，文件包含，笔记
php面向对象基础->调用符号构造函数construct,主要用来创建对象时初始化对象,为成员变量赋初始值,总与new运算符一起使用在创建对象的语句中析构函数destructor,与构造函数相 ...
Selenium+Java（六）Selenium 强制等待、显式等待、隐实等待
前言在实际测试过程中,由于网速或性能方面的原因,打开相应的网页后或在网页上做了相应的操作,网页上的元素可能不会马上加载出来,这个时候需要在定位元素前等待一下,等元素加载出来后再进行定位,根据实际使用 ...
对 /langversion 无效；必须是 ISO-1、ISO-2、3、4、5 或 Default
反编译或者.net用更高版本打开时会出现这个问题,解决办法如下: 1.网页版程序,将解决方案中的Web.config中的 /langversion 的值改为指定的值,既可以解决,我这里采用的是默认值, ...

python爬虫学习---爬取微软必应翻译（中英互译）

python爬虫学习---爬取微软必应翻译（中英互译）的更多相关文章

随机推荐

热门专题