python实现查有道词典

因为要考英语四级，所以我今天一大早就起来被英语单词，但是作为英语渣渣的我，只能是在网页上挨个查单词的意思。查的多了，心生厌倦，便想着如何才能在终端下查单词，那样速度不就很快了？

NOW，我仔细观察每次查询时，浏览器地址栏中URL的变化，发现每次浏览器提交的URL都是"http://www.youdao.com/w/eng/"xxxxx"/#keyfrom=dict2.index"(其中的xxxxx代表要查的单词)，有了这个发现，那我们将URL指向的网页下载下来，然后提取我们需要的信息不就得了？

这个工作交给Python来做是最合适不过的了

因为要英汉互译，所以我写了两段代码，第一个是汉译英，第二个是英译汉。（最后将两段代码合起来实现自动识别英语或汉语，但是正确性和效率比分开写差那么一点点，不过大多数时间我还是查英语的汉语意思）

源代码

汉译英：

import requests,re

def download():
    word=input("请输入您要翻译的中文词语：\n")
    url="http://dict.youdao.com/w/eng/"+word+"/#keyfrom=dict2.index"   #合并URL地址
    html=requests.get(url).content.decode('utf-8')    #得到服务器的相应信息后将其转码为UTF-8
    return html

def analysis():
    list1=re.findall("详细释义.+<p class=\"collapse-content\">",download(),re.S)   #这里对html字符串进行第一步加工，截取大概的信息
    list2=re.findall("                [a-zA-Z ]+",str(list1))      #将上面加工后的字符串进一步加工，直接提取到所有翻译后的单词信息
    print("翻译结果：\n")
    for i in list2:
        i=i.strip()   #因为第二步加工后的信息并不干净，得到的单词前面会有空格，这里将空格删去
        print(i)
if __name__ == '__main__':
　　while(1):
　　　　analysis()

英译汉：

import requests,re

def download():
    word=input("请输入您要翻译的英文单词：\n")
    url="http://dict.youdao.com/w/eng/"+word+"/#keyfrom=dict2.index"
    html=requests.get(url).content.decode('utf-8')
    return html

def analysis():
    list1=re.findall("详细释义.+<p class=\"collapse-content\">",download(),re.S)
    list2=re.findall("                \w+",str(list1))       #只有此处代码与汉译英代码不同，因为是提取汉字，所以这里要用\w来匹配汉字
    print("翻译结果：\n")
    for i in list2:
        i=i.strip()
        print(i)

if __name__ == '__main__':
　　while(1):
　　　　analysis()

合并后：

import requests,re

def analysis():
    word=input("请输入您要翻译的内容： ")
    url="http://dict.youdao.com/w/eng/"+word+"/#keyfrom=dict2.index"
    html=requests.get(url).content.decode('utf-8')
    print("翻译结果：")
    if ord(word[0].lower()) in range(97,123):   #将输入的第一个字节转换为数字，如果数字的值在97到123之间输入的一定是英语，否则输入的是汉语
        result=re.findall(r"(?<=                )\w+(?=</span>)",html)  #匹配翻译后的汉语
        for i in result:
                print(i)
    else:
        result=re.findall(r"(?<=                )[a-zA-Z ]+(?=</span>)",html) #匹配翻译后的英语
        for i in result:
            if ord(i[0].lower()) in range(97,123):   #上一步提取到的信息列表中有无用项（正则表达式中的空格造成的），这里过滤一下
                print(i)
if __name__ == '__main__':
    while(1):
        analysis()

OK，来看看效果吧：

emmmm，OK，发完博客还要继续背单词【伤心】【伤心】【伤心】

python实现查有道词典的更多相关文章

python学习笔记："爬虫+有道词典"实现一个简单的英译汉程序
1.有道的翻译网页:www.youdao.com Fig1 Fig2 Fig3 Fig4 再次点击"自动翻译"->选中'Network'->选中'第一项',如下: F ...
python：爬虫1——实战（下载一张图片、用Python模拟浏览器，通过在线的有道词典来对文本翻译）
一.下载一只猫 import urllib.request response = urllib.request.urlopen("http://cdn.duitang.com/uploads ...
Python下载一张图片与有道词典
1.下载一张图片代码1 import urllib.request response = urllib.request.urlopen('http://photocdn.sohu.com/201009 ...
python "爬虫+有道词典"实现一个简单翻译程序
抓包软件使用的是Fiddler4 新版的查询接口比较负责,引入了salt和sign http://fanyi.youdao.com/translate?smartresult=dict&sm ...
基于pygtk的linux有道词典
基于pygtk的linux有道词典一.桌面词典设计想把Linux用作桌面系统,其中一部分障碍就是Linux上没有像有道一样简单易用的词典.其实我们完全可以自己开发一款桌面词典, 而且开发一款桌面词 ...
mac 10.9开启有道词典取词功能
取词时候,有道词典给出提示,说要去开启辅助功能,但提示的是在mac 10.8上面怎么操作,在10.9的话,就是以下位置去改了. 补充以下: 在mac机器上,实际上大多数的单词都能从自带的词典中查找到. ...
爬虫破解js加密（一）有道词典js加密参数 sign破解
在爬虫过程中,经常给服务器造成压力(比如耗尽CPU,内存,带宽等),为了减少不必要的访问(比如爬虫),网页开发者就发明了反爬虫技术. 常见的反爬虫技术有封ip,user_agent,字体库,js加密, ...
必应词典手机版(IOS版)与有道词典(IOS版)之软件分析【功能篇】【用户体验篇】
1.序言: 随着手机功能的不断更新和推广,手机应用市场的竞争变得愈发激烈.这次我们选择必应词典和有道词典的苹果客户端作对比,进一步分析这两款词典的客户端在功能和用户体验方面的利弊.这次测评的主要评测人 ...
调用网易有道词典api
# -*- coding: utf-8 -*- #python 27 #xiaodeng #调用网易有道词典api import urllib import json class Youdao(): ...

随机推荐

Eight hdu 1043 八数码问题双搜
Eight Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Subm ...
SQL语句表名或者字段名和保留字冲突解决方法
最近开发遇到一个很奇葩的问题,简单做一下笔记 select * from Add ... 以上SQL语句会报错. 原因Add是表名,SQL语句保留字中又有Add 解决方法: select * from ...
MyBatis 配置的一些小知识点
MyBatis别名配置——typeAliases 类型别名是为 Java 类型设置一个短的名字.它只和 XML 配置有关,存在的意义仅在于用来减少类完全限定名的冗余.说白了就是预先设置包名 api是这 ...
想到一个赚钱的APP
通过APP上发布调查问卷的需求,鼓励人们注册,并给与一定的报酬.需求主要面向一些调查问卷,一类的需求发布
Echarts数据可视化legend图例，开发全解+完美注释
全栈工程师开发手册 (作者:栾鹏) Echarts数据可视化开发代码注释全解 Echarts数据可视化开发参数配置全解 6大公共组件详解(点击进入): title详解. tooltip详解.toolb ...
Github Page--CSDN新人的第二选择
我也是个CSDN新人,使用的CSDN的初衷应该和众人类似,就是想总结下平时的学习成果,或者一些想法. CSDN好的地方: 书写界面简洁,支持markdown语法人还算多,也比较年轻相对较活跃内容 ...
VIM格式化代码（How to format code with VIM）
1) 按两下小写g,即gg,定位光标到第一行.(2) 按住Shift+v,即大写V,进入可视化编辑的列编辑模式.(3) Shift+g,即大写G,选中整个代码.(4) 按下等号=,格式化所有代码.
java四大会话技术
未经作者允许,不得转载第一cookie技术常用方法: new Cookie(),构造一个cookie getName() ,获取cookie的名字 getValue () ,取到具体cookie的 ...
浅谈 var 关键字
提起 var关键子,程序员的第一反应就是JavaScript, 事实上这个关键子在其他语言中也有被采用. 比如说C#, 比如说kotlin, 用法和JavaScript中使用差不多,作为要声明变量的前 ...
LINUX 笔记-MOUNT
mount [-t vfstype] [-o options] device dir -o options: 主要用来描述设备或档案的挂接方式 1)loop:用来把一个文件当成硬盘分区挂上系统 2)r ...

python实现查有道词典

python实现查有道词典的更多相关文章

随机推荐

热门专题