python "爬虫+有道词典"实现一个简单翻译程序

抓包软件使用的是Fiddler4

新版的查询接口比较负责，引入了salt和sign

http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom=http://fanyi.youdao.com/

这里使用老版本的查询接口

http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/

代码:

# coding=utf-8

import urllib

import urllib2

import json

'''

功能说明:

根据输入要翻译的文字,进行有道自动翻译:

实现中文->英文、英语及其他语言->中文的转换

'''

class YoudaoFanyi:

    def __init__(self):

        self.url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'

        self.headers = {

            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36",

        }

    def get_encoded_payload(self, key):

        '''

        :param key: 带翻译的文字

        :return: 返回url编码过的数据

        '''

        payload = {

            "i": key,

            'type': 'AUTO',

            "doctype": "json",

            "xmlVersion": "1.8",

            "keyfrom": "fanyi.web",

            "action": "FY_BY_CLICKBUTTON",

            "typoResult": "true",

            "ue": "UTF-8"

        }

        data = urllib.urlencode(payload)

        return data

    def show_translate_result(self, html):

        '''

        解析返回的json数据

        :param html: 返回的json数据

        :return: None

        '''

        data = json.loads(html)

        print '*' * 10

        target = data['translateResult'][0][0]['tgt']

        print target

        if 'smartResult' in data:

            result = data['smartResult']['entries']

            result_str = '\n'.join(result[1:])  # result列表中第一个元素为""

            print '有道词典结果'

            print result_str

        print '*' * 10

    def translate(self, content):

        '''

        对输入的内容进行翻译

        :param content: 带翻译的内容

        :return: None

        '''

        payload = self.get_encoded_payload(content)  # 获取经过url编码后的数据

        request = urllib2.Request(

            self.url,

            data=payload,

            headers=self.headers)  # 构造请求

        response = urllib2.urlopen(request)  # 发送请求

        self.show_translate_result(response.read())  # 解析结果

if __name__ == '__main__':

    youdao = YoudaoFanyi()

    while True:

        key = raw_input("请输入你要翻译的文字[Q|quit 退出]: ").strip()

        if key in ['Q', 'quit']:

            break

        youdao.translate(key)

python "爬虫+有道词典"实现一个简单翻译程序的更多相关文章

python学习笔记："爬虫+有道词典"实现一个简单的英译汉程序
1.有道的翻译网页:www.youdao.com Fig1 Fig2 Fig3 Fig4 再次点击"自动翻译"->选中'Network'->选中'第一项',如下: F ...
python爬虫系列（1）——一个简单的爬虫实例
本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片. 1. 概述本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片.下载图片的步骤如下: 获取网页html文本内容:分析html中 ...
python爬虫（2）——编写一个爬虫
一.URL的编码与解码在python2中包含的urllib和urllib2,都是接受URL请求相关的模块.但是在python3中,却没有urllib2.实际上urllib2的功能在python3中可 ...
爬虫浅谈一：一个简单c#爬虫程序
这篇文章只是简单展示一个基于HTTP请求如何抓取数据的文章,如觉得简单的朋友,后续我们再慢慢深入研究探讨. 图1: 如图1,我们工作过程中,无论平台网站还是企业官网,总少不了新闻展示.如某天产品经理跟 ...
【应用】_有道词典客户端一个后缀名为sql的数据库。
[缘起] 在清理电脑磁盘的时候,看一看各安装文件夹有占用了多大容量,发现有道词典居然达140MB了,于是进去看看. 发现个有趣的文件:XXX.sql. 首先我们看一看它的安装文件夹的结构: Dict ...
Python学习笔记23:Django构建一个简单的博客网站（一个）
在说如何下载和安装Django,本节将重点讨论如何使用Django站点. 一新建project 命令:django-admin startproject mysite # 有的须要输入:django ...
[Python]网络爬虫（六）：一个简单的百度贴吧的小爬虫
转自:http://blog.csdn.net/pleasecallmewhy/article/details/8927832 # -*- coding: utf-8 -*- #----------- ...
我的第一个python web开发框架（2）——一个简单的小外包
第一部分说明第一部分大概有20来章,主要讲的是一些开发常识.开发前中后期准备内容.开发环境与服务器部署环境安装设置.python基础框架结构与功能等内容,代码会比较简单. 本系列会以故事的方式,向大 ...
【python爬虫】对喜马拉雅上一个专辑的音频进行爬取并保存到本地
>>>内容基本框架: 1.爬虫目的 2.爬取过程 3.代码实现 4.爬取结果 >>>实验环境: python3.6版本,pycharm,电脑可上网. [一爬虫目 ...

随机推荐

IIS 7上导入SSL证书
1.将SSL证书文件上传至服务器 2．导入证书 1)在IIS设置项中,打开‘服务器证书’ 2)选择导入 3)将网站绑定SSL证书
hdu2255 奔小康赚大钱二分图最佳匹配--KM算法
传说在遥远的地方有一个非常富裕的村落,有一天,村长决定进行制度改革:重新分配房子.这可是一件大事,关系到人民的住房问题啊.村里共有n间房间,刚好有n家老百姓,考虑到每家都要有房住(如果有老百姓没房子住 ...
Intellij部署Tomcat问题
Intellij部署Tomcat问题 Warnings:No artifacts marked for development 切换到Development标签页选择+按钮,并选择Artifacts ...
MySQL--时间戳属性2
在MySQL 5.6版本中引入参数explicit_defaults_for_timestamp设置,该参数会影响Timestamp的默认属性. 同时在MySQL 5.6版本中中,去除一张表只能有一个 ...
MySQL 5.7--多源复制(非GTID模式)
==================================================== 在MYSQL5.7版本中引入多源复制,一个从库允许复制多个主库的数据,每个主库被配置为一个单独 ...
timescaledb 集成 madlib
github 上有人提出了一个问题(2017 很早了),然后搜索timescaledb 的docs 文档,发现有一片介绍的文章,所以尝试运行下备注: 环境使用虚拟机安装(没有使用docker ma ...
gearman kubernetes 运行
备注: 使用的是golang 版本的实现,同时官方也提供了一个k8s 的helm 部署charts,我没有使用这个helm,而是通过kompose 这个工具直接转换的 docker-compose ...
01炼数成金TensorFlow基本概念
一.Tensorflow基本概念 1.使用图(graphs)来表示计算任务,用于搭建神经网络的计算过程,但其只搭建网络,不计算 2.在被称之为会话(Session)的上下文(context)中执行图 ...
深入详解美团点评CAT跨语言服务监控（九）CAT管理平台MVC框架
在第2章我们讲到,服务器在初始化CatServlet 之后, 会初始化 MVC,MVC也是继承自AbstractContainerServlet , 同样也是一个 Servlet 容器,这是一个非常古 ...
Jenkins发布后自动通知【钉钉】
阅读目录一.前言二.使用钉钉推送的优势三.配置一.前言最近使用Jenkins进行自动化部署,但是发布署后,并没有相应的通知,虽然有邮件发送通知,但是发现邮件会受限于大家接受的设置,导致不能及 ...

python "爬虫+有道词典"实现一个简单翻译程序

python "爬虫+有道词典"实现一个简单翻译程序的更多相关文章

随机推荐

热门专题