python爬有道翻译

在有道翻译页面中打开开发者工具，在Headers板块找到Request URL以及相应的data。

import urllib.request

import urllib.parse

import json

content=input('请输入需要翻译的内容:')

#_o要去掉，否则会出先error_code:50的报错

url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'

data={}

#开发者工具里有，i和doctype键不可少

data['i']=content

data['from']='AUTO'

data['to']='AUTO'

data['smartresult']='dict'

data['client']='fanyideskweb'

data['salt']=''

data['sign']='5b0565493d812bc5e713b895c12d615d'

data['doctype']='json'

data['version']='2.1'

data['keyfrom']='fanyi.web'

data['action']='FY_BY_REALTTIME'

#将字典类型的请求数据转化为url编码，并将编码类型转变为'utf-8'类型

data=urllib.parse.urlencode(data).encode('utf-8')

#向url请求data的响应结果

response=urllib.request.urlopen(url,data)

#读取返回数据内容，decode是转换返回数据的格式为str

html=response.read().decode('utf-8')

#使用json将字符串转化成字典

target=json.loads(html)

#结果在key='translateResult'的三层列表的key='tgt'中

print("翻译结果:%s" %(target['translateResult'][0][0]['tgt']))

上面这种很大可能被有道网页给识别出来不是人工在访问，而是代码在访问。

此时我们可以加个‘User-Agent’代理。通过设置User Agent来达到隐藏身份的目的，一般情况下浏览器是通过User-Agent来识别的。

通过调用urllib.request.Request()来设置UA。

class urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)

This class is an abstraction of a URL request.

　　url should be a string containing a valid URL.

　　headers should be a dictionary #headers要为字典

有两种方法设置User Agent：

1.在创建Request对象的时候，填入headers参数(包含User Agent信息)，这个Headers参数要求为字典；

2.在创建Request对象的时候不添加headers参数，在创建完成之后，使用add_header()的方法，添加headers。

import urllib.request

import urllib.parse

import json

import time

while True:

    content=input('请输入需要翻译的内容(输入"q!退出程序"):')

    if content=='q!':

        break;

    #_o要去掉，否则会出先error_code:50的报错

    url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'

    '''

    第一种方法

    head={}

    head['User-Agent']='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'

    '''

    data={}

    #开发者工具里有，i和doctype键不可少

    data['i']=content

    data['from']='AUTO'

    data['to']='AUTO'

    data['smartresult']='dict'

    data['client']='fanyideskweb'

    data['salt']=''

    data['sign']='5b0565493d812bc5e713b895c12d615d'

    data['doctype']='json'

    data['version']='2.1'

    data['keyfrom']='fanyi.web'

    data['action']='FY_BY_REALTTIME'

    #将字典类型的请求数据转化为url编码，并将编码类型转变为'utf-8'类型

    data=urllib.parse.urlencode(data).encode('utf-8')

    '''

    第一种方法

    req=urllib.request.Request(url,data,head)

    '''

    #第二种方法设置User Agent

    #创建Request对象

    req=urllib.request.Request(url,data)

    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36')

    #传入创建好的Request对象

    response=urllib.request.urlopen(req)

    #读取响应信息并解码

    html=response.read().decode('utf-8')

    #使用json将字符串转化成字典

    target=json.loads(html)

    #结果在key='translateResult'的三层列表的key='tgt'中

    print("翻译结果:%s" %(target['translateResult'][0][0]['tgt']))

    #5秒一次

    time.sleep(5)

python爬有道翻译的更多相关文章

Python 实现有道翻译命令行版
一.个人需求由于一直用Linux系统,对于词典的支持特别不好,对于我这英语渣渣的人来说,当看英文文档就一直卡壳,之前用惯了有道词典,感觉很不错,虽然有网页版的但是对于全站英文的网页来说并不支持.索性 ...
[Python] 使用有道翻译API
Python 使用youdao (有道翻译)API 想写一个给自己记录背单词状况的软件,需要获取英文单词的中文释义(基本功能).考虑使用有道翻译的API实现获取英文单词的中文释义的方法. 获取API_ ...
Python 使用有道翻译
最近想将一些句子翻译成不同的语言,最开始想使用Python向有道发送请求包的方式进行翻译. 这种翻译方式可行,不过只能翻译默认语言,不能选定语言,于是我研究了一下如何构造请求参数,其中有两个参数最复杂 ...
python利用有道翻译实现“语言翻译器”的功能
import urllib.request import urllib.parse import json while True: content = input('请输入需要翻译的内容(退出输入Q) ...
Python制作有道翻译小工具
该工具主要是利用了爬虫,爬取web有道翻译的内容. 然后利用简易GUI来可视化结果. 首先我们进入有道词典的首页,并点击翻译结果的审查元素之后request响应网页,并分析网页,定位到翻译结果. 使 ...
python爬虫-有道翻译-js加密破解
有道翻译-js加密破解这是本地爬取的网址:http://fanyi.youdao.com/ 一.分析请求我们在页面中输入:水果,翻译后的英文就是:fruit.请求携带的参数有很多,先将参数数据保存 ...
python调用有道翻译api实现翻译
通过调用有道翻译的api,实现中译英.其他语言译中文代码: # coding=utf-8 import urllib import urllib2 import json import time i ...
python爬取百度翻译返回：{'error': 997, 'from': 'zh', 'to': 'en', 'query 问题
解决办法: 修改url为手机版的地址:http://fanyi.baidu.com/basetrans User-Agent也用手机版的测试代码: # -*- coding: utf-8 -*- & ...
python爬取网易翻译和MD5加密
一.程序需要知识 1.python中随机数的生成 # 生成 0 ~ 9 之间的随机数 # 导入 random(随机数) 模块 import random print(random.randint(0, ...

随机推荐

SpringBoot中的@ConfigurationProperties
有什么用该注解的作用类似于@Value,即为组件中的属性进行赋值. 怎么用首先是建立一个springboot的工程,不再赘述. 首先我们建立一个Person类和一个Dog类. package co ...
java lambda怎么表达式判断被调用接口名称和接口中方法
1.首先能够用于lambda表达式的只能是interface,并且interface 中只有一个方法. 这就说明,只要找到接口类型就能确定用的是哪个方法.(如下:intTypeInterface.St ...
01_Android入门
Android系统文件目录结构 / 代表系统的根目录 /data/app/ 存放着第三方的apk文件 /system/app/ 其中是系统中的应用安装文件 /data/data/packagename ...
[转帖]Linux企业运维人员最常用150个命令汇总
Linux企业运维人员最常用150个命令汇总 https://clsn.io/clsn/lx998.html 基本上都用过了. 命令功能说明线上查询及帮助命令(2个) man 查看命令帮助,命令的 ...
spring框架学习(三)——AOP( 面向切面编程)
AOP 即 Aspect Oriented Program 面向切面编程首先,在面向切面编程的思想里面,把功能分为核心业务功能,和周边功能. 所谓的核心业务,比如登陆,增加数据,删除数据都叫核心业务 ...
《学渣的电子技术自学笔记》——三极管的放大区、截止区与饱和区(基于NPN型）
<学渣的电子技术自学笔记>--三极管的放大区.截止区与饱和区(基于NPN型) 1.放大区三极管输出特性曲线近似水平的部分是放大区.在放大区,\(I_C=\overline{β}I_B ...
xorm实例-创建xorm，映射
创建xorm引擎 //在xorm里面,可以同时存在多个Orm引擎,一个Orm引擎称为Engine, //一个Engine一般只对应一个数据库. //Engine通过调用`xorm.NewEngine` ...
c# 基于RTMP推流 PC+移动端拉流播放
网上关于直播相关的文章很多,但是讲解还是不够系统,对于刚刚接触直播开发的朋友实施起来会浪费不少时间.下面结合我自己的经验, 介绍一下直播方面的实战经验. 分成两个部分第一部分是标题中介绍的基于RTM ...
MySQL安装后的初始优化
mysql数据库在安装之后,有一些内置的库(test库).用户(如root@localhost.localdomain)是不需要的,而且在Linux系统上,yum安装的mysql是默认无root密码的 ...
EasyARM-iMX283 安装NFS
1. 安装NFS软件包在 ubuntu 上请输入下面命令:[chenxibing@localhost ~]$ sudo apt-get install nfs-kernel-server[chenxi ...

python爬有道翻译

python爬有道翻译的更多相关文章

随机推荐

热门专题