5-有道爬虫demo（post）

爬取有道页面，实现中文翻译成英文：

#_*_ coding: utf-8 _*_

'''

Created on 2018-7-12

@author: sss

功能：爬取有道翻译

'''

import urllib

import urllib.request

import urllib.parse

import urllib.response

from pip._vendor.urllib3.filepost import encode_multipart_formdata

from pip._vendor.distlib.compat import raw_input

import json

import random

# url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=null"

url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"  #http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule要把_o去掉

#user-agent列表，每次请求随机选一个：

ua_list = [

    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",

    "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko",

    "Mozilla/5.0 (X11; CrOS i686 2268.111.0)like Gecko",

    "Mozilla/5.0 (Macintosh; U; PPC Mac OS X ",

    "Mozilla/5.0 (Macintosh; Intel Mac OS "

]

user_agnet = random.choice(ua_list)

headers = {

        "Connection" : "keep-alive",

        "Accept" : "application/json, text/javascript, */*; q=0.01",

        "X-Requested-With" : "XMLHttpRequest",

        "User-Agent" : user_agnet,

        "Content-Type" : "application/x-www-form-urlencoded; charset=UTF-8",

        "Referer" : "http://fanyi.youdao.com/"

    }

key = raw_input("请输入需要翻译的文字：\n")

formdata = {

        "i" :key,

        "from " :"AUTO",

        "to" :"AUTO",

        "smartresult" :"dict",

        "client" :"fanyideskweb",

        "salt" :"1531403738742",  #这个应该是个时间戳

        "sign" :"ffa2b29fe52953208226d97a174bcea7", #应该是根据时间戳+你要翻译的内容加密后生成的验证字段

        "doctype" :"json",

        "version" :"2.1",

        "keyfrom" :"fanyi.web",

        "action" :"FY_BY_REALTIME",

        "typoResult" :"false"

    }

data = urllib.parse.urlencode(formdata ).encode(encoding='UTF8')  #这里后面要加encoding='utf-8'

request = urllib.request.Request(url, data = data, headers = headers)

html = urllib.request.urlopen(request).read()

print(html)

print('完成！')

target = json.loads(html)

print("翻译结果：%s"%(target['translateResult'][0][0]['tgt'])) #读出结果

print(headers)

5-有道爬虫demo（post）的更多相关文章

# [爬虫Demo] pyquery+csv爬取猫眼电影top100
目录 [爬虫Demo] pyquery+csv爬取猫眼电影top100 站点分析代码君 [爬虫Demo] pyquery+csv爬取猫眼电影top100 站点分析 https://maoyan.co ...
关于Android程序设计—有道词典demo转移至coding的公告
有道词典的demo以及解析已转移至Coding https://coding.net/u/monsterLin/p/WebView_YouDao/git
学习用java基于webMagic+selenium+phantomjs实现爬虫Demo爬取淘宝搜索页面
由于业务需要,老大要我研究一下爬虫. 团队的技术栈以java为主,并且我的主语言是Java,研究时间不到一周.基于以上原因固放弃python,选择java为语言来进行开发.等之后有时间再尝试pytho ...
关于使用Java实现的简单网络爬虫Demo
什么是网络爬虫? 网络爬虫又叫蜘蛛,网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直 ...
简单横道图Demo
代码(每个月都显示整月): @{ ViewBag.Title = "横道图"; Layout = "~/Views/Shared/_Layout.cshtml" ...
我的图片爬虫demo
本来是根据scrapy教程写了一个下载图片的简易爬虫,但是搞了一天,死活下载不了图片. 然后换了一个网站,用原生的库写了一个图片爬虫. import urllib.requestimport osde ...
『Scrapy』全流程爬虫demo
建立好的爬虫工程如下: item.py 它用来存储解析后的响应文件: # -*- coding: utf-8 -*- # Define here the models for your scraped ...
java编写的一段简单的网络爬虫demo代码
功能: 从网站上下载附件,并从页面中提取页面文章内容关于NIO 在大多数情况下,Java 应用程序并非真的受着 I/O 的束缚.操作系统并非不能快速传送数据,让 Java 有事可做:相反,是 JVM ...
sanic+aiohttp爬虫demo(爬图片，新闻，数据)
直接上代码,都是很简单的一些demo,爬取的网站,都没有什么加密措施,所以应该不涉及违法数据,哈哈 1.爬取网页数据(aiohttp+sanic+scrapy+xpath解析html) from sa ...

随机推荐

linux rhel7下安装python
1.查看是否已经安装Python Centos7默认安装了python2.7.5 因为一些命令要用它比如yum 它使用的是python2.7.5. 使用python -V命令查看一下是否安装Pytho ...
剑指offer-第五章优化时间和空间效率（数组中出现次数超过一半的数字）
题目:输入一个数组,找出一个数字,它在数组中出现的次数超过数组的一半. 题目规定如果可以改变数组中元素的位置. 思路1:如果数组是排序的,那么中间元素的位置不就是次数超过数组一半的元素吗?是的,因此我 ...
matlab中一些常用的函数
stem函数h = stem(x,y); %绘制火柴梗图 ,stem的工作原理是,根据一个x对应一个y,绘制火柴梗图.
洛谷 P2945 [USACO09MAR]沙堡Sand Castle
传送门题目大意: ai,ai+1,ai+2... 变成 bi,bi+1,bi+2.. 不计顺序,增加和减少a数组均有代价. 题解:贪心+排序小的对应小的代码: #include<iostr ...
1.1对java web开发的一点理解
前言 Q:通常行内人士见面会问你,你做哪方面开发的? A:java web开发的那么,什么是java web开发? java web开发通常是指java web应用程序的开发.一个B/S架构的 we ...
转 OpenFaaS 介绍
来源: https://thenewstack.io/openfaas-put-serverless-function-container/?utm_source=tuicool&utm_me ...
bzoj 4310 跳蚤——后缀数组+二分答案+贪心
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=4310 答案有单调性? 二分出来一个子串,判断的时候需要满足那些字典序比它大的子串都不出现! ...
nginx.conf自己整理的中文解读
自己收集了网上有关conf文件的中文详解,这样以后就不怕看不懂nginx的配置文件啦! #定义Nginx运行的用户和用户组user www www; #nginx进程数,建议设置为等于CPU总核心数. ...
数据科学：Pandas 和 Series 的 describe() 方法
一.Pandas 和 Series 的 describe() 方法 1)功能功能:对数据中每一列数进行统计分析:(以“列”为单位进行统计分析) 默认只先对“number”的列进行统计分析: 一列数据 ...
Vue.js：自定义指令
ylbtech-Vue.js:自定义指令 1.返回顶部 1. Vue.js 自定义指令除了默认设置的核心指令( v-model 和 v-show ), Vue 也允许注册自定义指令. 下面我们注册一 ...

5-有道爬虫demo（post）

5-有道爬虫demo（post）的更多相关文章

随机推荐

热门专题