python "爬虫+有道词典"实现一个简单翻译程序

抓包软件使用的是Fiddler4

新版的查询接口比较负责，引入了salt和sign

http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom=http://fanyi.youdao.com/

这里使用老版本的查询接口

http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/

代码:

# coding=utf-8

import urllib

import urllib2

import json

'''

功能说明:

根据输入要翻译的文字,进行有道自动翻译:

实现中文->英文、英语及其他语言->中文的转换

'''

class YoudaoFanyi:

    def __init__(self):

        self.url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'

        self.headers = {

            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36",

        }

    def get_encoded_payload(self, key):

        '''

        :param key: 带翻译的文字

        :return: 返回url编码过的数据

        '''

        payload = {

            "i": key,

            'type': 'AUTO',

            "doctype": "json",

            "xmlVersion": "1.8",

            "keyfrom": "fanyi.web",

            "action": "FY_BY_CLICKBUTTON",

            "typoResult": "true",

            "ue": "UTF-8"

        }

        data = urllib.urlencode(payload)

        return data

    def show_translate_result(self, html):

        '''

        解析返回的json数据

        :param html: 返回的json数据

        :return: None

        '''

        data = json.loads(html)

        print '*' * 10

        target = data['translateResult'][0][0]['tgt']

        print target

        if 'smartResult' in data:

            result = data['smartResult']['entries']

            result_str = '\n'.join(result[1:])  # result列表中第一个元素为""

            print '有道词典结果'

            print result_str

        print '*' * 10

    def translate(self, content):

        '''

        对输入的内容进行翻译

        :param content: 带翻译的内容

        :return: None

        '''

        payload = self.get_encoded_payload(content)  # 获取经过url编码后的数据

        request = urllib2.Request(

            self.url,

            data=payload,

            headers=self.headers)  # 构造请求

        response = urllib2.urlopen(request)  # 发送请求

        self.show_translate_result(response.read())  # 解析结果

if __name__ == '__main__':

    youdao = YoudaoFanyi()

    while True:

        key = raw_input("请输入你要翻译的文字[Q|quit 退出]: ").strip()

        if key in ['Q', 'quit']:

            break

        youdao.translate(key)

python "爬虫+有道词典"实现一个简单翻译程序的更多相关文章

python学习笔记："爬虫+有道词典"实现一个简单的英译汉程序
1.有道的翻译网页:www.youdao.com Fig1 Fig2 Fig3 Fig4 再次点击"自动翻译"->选中'Network'->选中'第一项',如下: F ...
python爬虫系列（1）——一个简单的爬虫实例
本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片. 1. 概述本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片.下载图片的步骤如下: 获取网页html文本内容:分析html中 ...
python爬虫（2）——编写一个爬虫
一.URL的编码与解码在python2中包含的urllib和urllib2,都是接受URL请求相关的模块.但是在python3中,却没有urllib2.实际上urllib2的功能在python3中可 ...
爬虫浅谈一：一个简单c#爬虫程序
这篇文章只是简单展示一个基于HTTP请求如何抓取数据的文章,如觉得简单的朋友,后续我们再慢慢深入研究探讨. 图1: 如图1,我们工作过程中,无论平台网站还是企业官网,总少不了新闻展示.如某天产品经理跟 ...
【应用】_有道词典客户端一个后缀名为sql的数据库。
[缘起] 在清理电脑磁盘的时候,看一看各安装文件夹有占用了多大容量,发现有道词典居然达140MB了,于是进去看看. 发现个有趣的文件:XXX.sql. 首先我们看一看它的安装文件夹的结构: Dict ...
Python学习笔记23:Django构建一个简单的博客网站（一个）
在说如何下载和安装Django,本节将重点讨论如何使用Django站点. 一新建project 命令:django-admin startproject mysite # 有的须要输入:django ...
[Python]网络爬虫（六）：一个简单的百度贴吧的小爬虫
转自:http://blog.csdn.net/pleasecallmewhy/article/details/8927832 # -*- coding: utf-8 -*- #----------- ...
我的第一个python web开发框架（2）——一个简单的小外包
第一部分说明第一部分大概有20来章,主要讲的是一些开发常识.开发前中后期准备内容.开发环境与服务器部署环境安装设置.python基础框架结构与功能等内容,代码会比较简单. 本系列会以故事的方式,向大 ...
【python爬虫】对喜马拉雅上一个专辑的音频进行爬取并保存到本地
>>>内容基本框架: 1.爬虫目的 2.爬取过程 3.代码实现 4.爬取结果 >>>实验环境: python3.6版本,pycharm,电脑可上网. [一爬虫目 ...

随机推荐

s21day02 python笔记
s21day02 python笔记一.昨日内容回顾及补充内容回顾补充 if条件语句嵌套 10086示例 pycharm更改解释器 python3.7解释器 python2.7解释器二.循环语句 ...
c++——最大子列和
最大子列和问题 //O(N^3) int MaxSubseqSum1(int A[],int N){ ; int i,j,k; ;i<N;i++){ for(j=i;j<N;j++) Th ...
Linux Distribution 分支
https://distrowatch.com/ DistroWatch是一个包含了各种Linux发行版及其他自由/开放源代码的类Unix操作系统的新闻.人气排名.以及其他一般信息等的网站.它包含了数 ...
Windows共享设置
Windows文件共享默认是开启的,任何用户都可以方便的设置共享目录.那么如何关闭并禁止呢. ====打开或关闭网上邻居的网络发现:1. 右键单击,网上邻居,弹出菜单选择:属性,打开网络和共享中心界面 ...
loading加载的代码
<!DOCTYPE html><html> <head> <meta charset="UTF-8"> <title>& ...
如何将备份的oracle数据库还原到指定用户下。
上一文章 oracle11g数据库--创建表空间,创建用户,用户授权并指定表空间.我们已经建好了指定的新用户pdmis. 接下来我们需要将备份好的数据库,还原至新用户pdmis下. 想要还原,我们需要 ...
Redis怎么保持缓存与数据库一致性？
将不一致分为三种情况: 1. 数据库有数据,缓存没有数据: 2. 数据库有数据,缓存也有数据,数据不相等: 3. 数据库没有数据,缓存有数据. 在讨论这三种情况之前,先说明一下我使用缓存的策略,也是大 ...
性能测试之mysql监控、优化
我们在做性能测试的目的是什么,就是要测出一个系统的瓶颈在哪里,到底是哪里影响了我们系统的性能,找到问题,然后解决它.当然一个系统由很多东西一起组合到一起,应用程序.数据库.服务器.中中间件等等很多东西 ...
IP地址转换函数
只适用于IPV4 inet_addr函数将用点分十进制字符串表示的IPv4地址转化为用网络字节序整数表示的IPv4地址. 失败时返回INADDR_NONE. inet_aton函数完成和inet_ad ...
TypeScript 之三斜线指令
https://m.runoob.com/manual/gitbook/TypeScript/_book/doc/handbook/Triple-Slash%20Directives.html 一个三 ...

python "爬虫+有道词典"实现一个简单翻译程序

python "爬虫+有道词典"实现一个简单翻译程序的更多相关文章

随机推荐

热门专题