python3爬虫：利用urllib与有道翻译获得翻译结果

在实现这一功能时遇到了一些困难，由于按照《零基础入门python》中的代码无法实现翻译，会爆出“您的请求来源非法，商业用途使用请关注有道翻译API官方网站“有道智云”: http://ai.youdao.com”这种神奇的错误。无奈百度，在一篇不错的博主上找到一个优化的代码，可以实现。分享一下链接https://blog.csdn.net/c406495762/article/details/59095864#comments

 from urllib import request

 from urllib import parse

 import json

 if __name__ == "__main__":

     # 对应上图的Request URL

     request_url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"

     # 创建Form Data字典，存储上图中的Form Data

     Form_Data = {}

     Form_Data['i'] = 'love'

     Form_Data['from'] = 'AUTO'

     Form_Data['to'] = 'AUTO'

     Form_Data['smartresult'] = 'dict'

     Form_Data['client'] = 'fanyideskweb'

     Form_Data['doctype'] = 'json'

     Form_Data['version'] = '2.1'

     Form_Data['keyfrom'] = 'fanyi.web'

     Form_Data['action'] = 'FY_BY_REALTIME'

     Form_Data['typoResult'] = 'false'

     # 使用urlencode方法转换标准格式

     data = parse.urlencode(Form_Data).encode('utf-8')

     # 传递Request对象和转换完格式的数据

     response = request.urlopen(request_url, data)

     # 读取信息并解码

     html = response.read().decode('utf-8')

     # 使用json

     translate_results = json.loads(html)

     # 找到翻译结果

     translate_result = translate_results["translateResult"][0][0]['tgt']

     # 打印翻译结果

     print("翻译的结果是 %s" % translate_result)

还有一个我在上面报错的链接里的API看到了一个版本，写了一个对应匹配参数要求的爬虫。

（原demo无法正常运行。。我是少了个包所以就自己改写了）

对了，使用这个方法需要在有道智云注册一个账号(收费的，不过第一次注册送100)然后需要进入我的应用里创个新应用，里面的接入方式选API，就能得到一个账号密码了

这是我修改demo后的代码

# -*- coding: utf-8 -*-

import sys

import uuid

import urllib.request

import urllib.parse

import hashlib

import time

import json

YOUDAO_URL = 'http://openapi.youdao.com/api'

APP_KEY = 'ID用自己的吧2333'

APP_SECRET = '密码当然也是'

def encrypt(signStr):

    hash_algorithm = hashlib.sha256()

    hash_algorithm.update(signStr.encode('utf-8'))

    return hash_algorithm.hexdigest()

def truncate(q):

    if q is None:

        return None

    size = len(q)

    return q if size <= 20 else q[0:10] + str(size) + q[size - 10:size]

def do_request(data):

    headers = {'Content-Type': 'application/x-www-form-urlencoded'}

    return urllib.request.Request(YOUDAO_URL, data=data, headers=headers)

q = input("请输入查询的单词：\n")

data = {}

data['from'] = 'EN'

data['to'] = 'zh-CHS'

data['signType'] = 'v3'

curtime = str(int(time.time()))

data['curtime'] = curtime

salt = str(uuid.uuid1())

signStr = APP_KEY + truncate(q) + salt + curtime + APP_SECRET

sign = encrypt(signStr)

data['appKey'] = APP_KEY

data['q'] = q

data['salt'] = salt

data['sign'] = sign

data = urllib.parse.urlencode(data).encode('utf-8')

req = do_request(data)

response = urllib.request.urlopen(req)

html = response.read().decode()

target = json.loads(html)

print(target['web'][0]['value'])

#上面的输出可以自己定义，输出target看自己需求输出吧

python3爬虫：利用urllib与有道翻译获得翻译结果的更多相关文章

Python3爬虫利用百度地图api得到城市经纬度
有2种方式,第一种是利用urllib , 方法1:利用urllib , 先把url 转成urlcode,然后读取网页,读到网页再用json读取内容,比较麻烦. 可以在浏览器输入,看一下格式. http ...
python3爬虫之Urllib库（一）
上一篇我简单说了说爬虫的原理,这一篇我们来讲讲python自带的请求库:urllib 在python2里边,用urllib库和urllib2库来实现请求的发送,但是在python3种在也不用那么麻烦了 ...
python3爬虫 - 利用浏览器cookie登录
http://blog.csdn.net/pipisorry/article/details/47980653 爬虫爬网站不免遇到需要登录的问题. 登录的时候可能还会碰到需要填验证码的问题, 有的验证 ...
python3爬虫之Urllib库（二）
在上一篇文章中,我们大概讲了一下urllib库中最重要的两个请求方法:urlopen() 和 Request() 但是仅仅凭借那两个方法无法执行一些更高级的请求,如Cookies处理,代理设置等等 ...
6.python3爬虫之urllib库
# 导入urllib.request import urllib.request # 向指定的url发送请求,并返回服务器响应的类文件对象 response = urllib.request.urlo ...
python3 爬虫利用Requests 实现下载进度条
一.编写代码 from datetime import datetime,date,timedelta from contextlib import closing import urllib,url ...
python3爬虫之urllib初探
urllib主要包含request(请求模块).error(异常处理模块).parse(工具模块).robotparser(识别网站的robots.txt文件,是否允许爬取). request(请求模 ...
爬虫模拟有道字典进行翻译,还发现了一条好玩的js
08.14自我总结爬虫模拟有道字典进行翻译一.代码 import requests from lxml.html import etree # headers= { # 'User-Agent': ...
爬虫之urllib包
urllib简介简介 Python3中将python2.7的urllib和urllib2两个包合并成了一个urllib库 Python3中,urllib库包含有四个模块: urllib.reques ...

随机推荐

php速成_day3
一.MySQL关系型数据库 1.什么是数据库数据库数据存储的仓库,在网站开发应用当中,需要有一些数据存储起来. 注册的用户信息,使用PHP变量只是一个临时的存储,如果需要永久的存储起来,就把数据存 ...
spring学习之第一个spring程序
spring的入门程序 1.在Eclipse中创建Java项目,并将spring的四个核心包和依赖包添加到src里,发布到类路劲下,项目如图所示: 2.UserDao程序如下: package com ...
EL表达式和JSTL（一）
一. 初始JavaBean 在软件开发时,有些数据时经常要用到的,为了方便进行移植,Sun公司提出了一种JavaBean技术,使用JavaBean对这些数据进行封装,做到一次编写,到处开发. Java ...
python os.path.dirname() abspath()
测试文件的名称 path_test.py 先确定文件目录 (my_flask3) python@ubuntu:~/Desktop/flask_news_pro$ python path_test.py ...
题解【DP100题1~10】
哎~这事做晚了~ (Dp100计划T1) 只有蓝题及以上才会水题解分行Dp,行间没有转移 \[ F[L][R] = max(F[L+1][R]+2^k \times V[L],F[L][R-1]+2 ...
20199324《Linux内核原理与分析》第十二周作业
格式化字符串漏洞实验一. 实验描述格式化字符串漏洞是由像 printf(user_input) 这样的代码引起的,其中 user_input 是用户输入的数据,具有 Set-UID root 权限 ...
java多线程高并发的学习
1. 计算机系统使用高速缓存来作为内存与处理器之间的缓冲,将运算需要用到的数据复制到缓存中,让计算能快速进行:当运算结束后再从缓存同步回内存之中,这样处理器就无需等待缓慢的内存读写了. 缓 ...
Java之异常的处理(try-catch)
import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java. ...
eclipse利用sql语句对Oracle数据库进行操作
对Oracle数据库执行操作的sql语句中表名和列名都需用英文双引号("")括起来. 注(\为转义符) 1.插入数据 sql = "insert into \" ...
Codeforces 1288A - Deadline
题目大意: Adilbek有一个特殊项目,他需要运行这个项目得到结果. 但是这个项目直接运行需要消耗d天时间. 他也可以选择优化程序以减少程序运行消耗时间. 假设他用了x天优化程序,那么最后运行程序只 ...

python3爬虫：利用urllib与有道翻译获得翻译结果

python3爬虫：利用urllib与有道翻译获得翻译结果的更多相关文章

随机推荐

热门专题