python截取搜索引擎关键词

这段代码是自己学了python的基本语法之后，参考一个网上视频写的代码，功能是截取搜索引擎360的关键词。

代码：

 #!/usr/bin/python

 #encoding:utf-8

 import urllib

 import urllib2

 import re

 import time

 from random import choice

 ipList = ['1.9.189.65:3128', '27.24.158.130:80', '27.24.158.154:80']

 listKeyWords = ["集团", "科技"]

 for item in listKeyWords:

     ip = choice(ipList)

     gjc = urllib.quote(item)

     url = "http://sug.so.360.cn/suggest?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word=" + gjc

     headers = {

         "GET":url,

         "Host":"sug.so.360.cn",

         "Referer":"http://www.so.com/",

         "User-Agent":"Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/37.0.2062.120 Chrome/37.0.2062.120 Safari/537.36"

     }

     #proxy_support = urllib2.ProxyHandler({"http":"http://"+ip})

     #opener = urllib2.build_opener(proxy_support)

     #urllib2.install_opener(opener)

     req = urllib2.Request(url)

     for key in headers:

         req.add_header(key, headers[key])

     html = urllib2.urlopen(req).read()

     print html

     ss = re.findall("\"(.*?)\"", html)

     for item in ss:

         print item

     time.sleep(3)

主要使用了python自i带的几个库，用法可以查看帮助文档。

python截取搜索引擎关键词的更多相关文章

搜索引擎关键词劫持之php篇(源码与分析)
摘要:其实原理很简单: 搜索引擎关键词劫持的过程实际上就是,修改肉鸡站点(webshell站点)A的首页(希望被搜索引擎收录的页面,一般情况下是首页),使之做出如下判断: if(来访者是蜘蛛){ 输出 ...
搜索引擎关键词劫持之asp篇
摘要:关键词劫持(黑帽seo)其实原理很简单:搜索引擎关键词劫持的过程实际上就是,修改肉鸡站点(webshell站点)A的首页(希望被搜索引擎收录的页面,一般情况下是首页),使之做出判断... 黑帽S ...
随笔——python截取http请求报文响应头
随笔——python截取http请求报文响应头标签: pythonhttp响应头 2014-05-29 09:32 2114人阅读评论(0) 收藏举报分类: 随笔(7) 版权声明:本文为博 ...
python截取中文字符串
python的中文处理还是比较麻烦的,utf-8的字符串的长度是1-6个字符,一不小心就会从中截断,出现所谓的乱码.下面这个函数提供了,从一段utf-8编码的字符串中,截取固定长度的字串.ord(ch ...
Python爬虫根据关键词爬取知网论文摘要并保存到数据库中【入门必学】
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:崩坏的芝麻由于实验室需要一些语料做研究,语料要求是知网上的论文摘要 ...
PHP获取搜索引擎关键词
有时候我们需要知道用户通过哪个搜索引擎,通过拿个关键词访问我们页面,当然js也可以实现,这里介绍下php的实现代码,包含(百度.谷歌.雅虎.搜狗.搜搜.必应.有道)几大搜索引擎的获取方法. //获取来 ...
python截取视频制作动态表情包+文字
1:安装moviepy库 2:安装IPython库代码如下: from moviepy.editor import * from IPython.display import Image def B ...
搜索引擎关键词劫持之.net篇
摘要:蛋疼写的,有需要的就拿去,注意要保存为Global.asax. 重要说明:为避免编码问题,请在劫持页面(data_url)指向页面加入meta标记来指明编码,如 meta content=tex ...
python 截取取出一部分的字符串
下面是split截取获得 >>> str = 'http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a5 ...

随机推荐

Educational Codeforces Round 33 (Rated for Div. 2) A. Chess For Three【模拟/逻辑推理】
A. Chess For Three time limit per test 1 second memory limit per test 256 megabytes input standard i ...
Jmeter进行webSocket接口测试
一.运行Jmeter (1) 去官方网站下载jmeter(版本为3.3)并解压.点击bin/jmeter.bat启动jmeter (2) 新建线程组. (3) 在线程组中新建WebSocket Sa ...
luogu P1145 约瑟夫
题目描述 n个人站成一圈,从某个人开始数数,每次数到m的人就被杀掉,然后下一个人重新开始数,直到最后只剩一个人.现在有一圈人,k个好人站在一起,k个坏人站在一起.从第一个好人开始数数.你要确定一个最小 ...
又是一年NOIP然鹅我考的是高数（虽然我没打并且内容与NOIP无关）（手动滑稽）
好长时间没有写过总结了.也是高三结束,自招结束.成功的由国宝变为四害,整个人也是完全放松的,或者说是放肆的. 整个暑假都是游戏睡觉,游戏睡觉,也没有干什么有意义的事.有人说别人都在学习大一课程的时候我 ...
Java混乱的日志体系（logback）（转）
作为一名 Java 程序员,日常开发工作中肯定会接触日志系统,但是众多的框架,包括 Log4j.Log4j2.Logback.Slf4j.Apache Common logging 等等,引用的 ma ...
Delphi Modbus RTU CRC16校验码
function CheckCrc16(const ABuf; ALen: Integer): Boolean;var uwTemp: WORD; i, j: BYTE; P: PByte;begin ...
【Mysql】字段排序中文排序
在mysql中如果字段的值是中文的话,排序结果往往不符合人意. 所以如果要中文排序正常的话,可以使用如下函数 SELECT huayangare0_.id AS id1_0_, huayangare ...
Makefile之文件搜索
Makefile之文件搜索 1.Makefile 文件中的"VPATH"变量如果没有指明这个变量,make只会在当前目录下查找依赖文件和目标文件: 如果定义了这个变量,make会 ...
account for 与led to和result in的区别
account for sth:be the explanation of sth; explain the cause of sth 作某事物的解释; 解释某事物的原因:His illness ac ...
Hive 性能调优
避免执行MR select * or select field1,field2 limit 10 where语句中只有分区字段或该表的本地字段使用本地set hive.exec.mode.local ...

python截取搜索引擎关键词

python截取搜索引擎关键词的更多相关文章

随机推荐

热门专题