百度url解析Joe.Smith整理大全

百度url解析Joe.Smith整理大全...1

本文链接:http://blog.csdn.net/qq_26816591/article/details/53335987#t23

所给出的

参考百度rul:

https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=2&tn=baiduhome_pg&wd=java&rsv_spt=1&oq=java&rsv_pq=9ae87b9e0000af9a&rsv_t=64a2xLPgOIqVeiuTYMJ2vghLIMU2amOkhpFAUsNeIXZ6aMAmwitsrebiPa%2BGy1E8WWZa&rqlang=cn&rsv_enter=0&rsv_sug3=1&rsv_sug1=1&rsv_sug7=100&rsv_sug4=1395

格式整理后:

https:

安全套接字层传送的超文本传输协议

//www.baidu.com/

:baidu的域名

s?

s: 这是一种无扩展名的方法实现的

ie=utf-8

ie:关键字编码格式默认为:GB2312 简体中文

f=8

f:   值有:1,3,8大概还有其他的,临时发现就这3种,

1指的是相干搜索,透露表现用户选择了搜索页面最下面的“相干搜索”中的某个关键词。;

3下拉框搜索透露表现用户输入肯定的词语之后出现“联想词语”,用户最终用鼠标选择了某个关键词;或用键盘选择了某个关键词后直接按回车。;

8用户自立搜索,透露表现用户直接点击“百度一下”按键(有bs变量时才出现f=8)

rsv_bp=1

rsv_bp:使用的是百度哪一个搜索框0是首页输入;1是顶部搜索输入;2是底部搜索输入

rsv_idx=2

rsv idx:未知

tn=baiduhome_pg

tn: 提交搜索请求来源例如:tn=50000021_hao_pg用hao123 里的百度搜的

tn=baidulocal表示百度站内搜索,返回的结果很干净,无广告干扰。

当tn= baiduerr  表示这是从错误页搜索跳转过来的

wd=java

wd:查询关键字 (word) 一般以也会是一串字符例如:%e4%bb%a5%e6%a2%a6%e4%b8%ba%e9%a9%ac%e8%af%97%e9%85%92%e8%b6%81%e5%b9%b4%e5%8d%8e  如果你用url编码方式进行解码你才能看到真实的内容

rsv_spt=1

rsv_spt:表示首页搜索浏览器内核版本类型,

1表示新版百度首页搜索(先要登录百度帐号)

2表示百度实时热点搜索(先要登录百度帐号)

3表示传统百度首页搜索

oq=java

oq:上次索引关键字

rsv_pq=9ae87b9e0000af9a

rsv_pq:透露表现用来记录关键词和上一次搜素的关键词(相干关键词)的

rsv_t

rsv_t=64a2xLPgOIqVeiuTYMJ2vghLIMU2amOkhpFAUsNeIXZ6aMAmwitsrebiPa%2BGy1E8WWZa

rsv_t:搜索效果的一种随机密码珍爱措施

rqlang=cn

rqlang:跟地域有关cn是代表中国地域

rsv_enter=0

rsv_enter:未知

rsv_sug=1

含义 搜索框提示的搜索历史记录(Search history)

参数值:0 搜索框提示0条搜索历史记录1 搜索框提示1条搜索历史记录2 搜索框提示2条搜索历史记录

inputT=2335

inputT:透露表现的是搜索相应时间,单位是毫秒;

rsv_sug3=1

未知

rsv_sug1=1

搜索框提示次数

rsv_sug7=100

未知

rsv_sug4=1395

未知

rev_ers

ers: rsv_ers xn* (*取0或1) 指的是搜索词后,翻页出现对应的相干搜索,从0开始。假如在url里已经是0的话,那对应的相干搜索就从1开始(这个参数还有许多密,这个只是初步测试

rn

rn:每页显示数目  默认为10 最大50

pn

pn:显示结果页数默认为0 其他每页递增rn 即:rn为20时第1页 pn=0 第2页 pn=20 第3页 pn=40

cl

cl: 百度提交的搜索类型(Class),cl=3为网页搜索,cl=2为百度消息

ct

语言限定。0-所有语言,1-简体中文网页,2-繁体中文网页;其它不确定或者无效或。默认值为0.

si

在限定的域名中搜索,比如想在本站内搜索可使用参数si=shangzhiwang.com,要使这个参数有效必须结合ct参数一起使用;

bs(Before Search)

上一次搜索的关键词;

lm=0

搜索结果时间限制)以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制。

ft

搜索的文档格式,pdf、doc、xls、ppt、rtf等,默认值为空。

q1

包含以下的悉数的关键词

q2

包含以下的完备关键词

q3

包含以下任意一个关键词

q4

不包括以下关键词

q5

搜索内容位置限制.0-所有内容;1-网页标题(相当于使用'title:'查询前缀);2-url(相当于使用'inurl:'查询前缀);其它值等效于0.默认值为0

q6

搜索内容网站限制.例如q6=sohu.com,表示只搜索sohu.com的网页;相当于使用了'site:前缀'.默认值为空

dq

不建议使用该参数.查询内容来原的地区限制.

还有更多关键字,希望大家多提意见,大家共同学习。

仅供学习使用请勿用于商业或其他非法用途,一切责任均与作者无关,此文章仅供学习使用不支持用于hack行为。

版权说明

著作权归作者所有©。 
商业转载请联系作者获得授权,非商业转载请注明出处。 
本文作者:Joe.Smith

发表日期:2016年11月25日 
本文链接:http://blog.csdn.net/qq_26816591/article/details/53335987#t23

来源:CSDN 
更多内容:百度搜索技巧

百度url解析Joe.Smith整理大全的更多相关文章

  1. 百度url 参数详解全

    百度url解析Joe.Smith整理大全 百度url解析Joe.Smith整理大全...1 本文链接:http://blog.csdn.net/qq_26816591/article/details/ ...

  2. 百度URL參数解析

    百度URL參数解析 在用Python爬取百度搜索的内容时,发现百度搜索的url非常的长.往往会跟一大段的參数,但事实上非常多參数都是没有必要的,如相同是搜索javakeyword,能够通过 http: ...

  3. 百度URL参数解析

    在用Python爬取百度搜索的内容时,发现百度搜索的url非常的长,往往会跟一大段的参数,但其实很多参数都是没有必要的,如同样是搜索java关键字,可以通过 http://www.baidu.com/ ...

  4. 简单的URL解析

    简单的URL解析,直接举例说明了 function getUrl(){ //如果存在则取到来后面的参数,注意,?不需要取出,substring从1开始,否则取""; var qs ...

  5. ThinkPHP中URL解析原理,以及URL路由使用教程!

    几个概念: THINKPHP 是一个MVC框架,使用PATHINFO解析出分组名,模块名,方法名,以及参数. PATHINFO:就是 http://localhost/index.php/Home/I ...

  6. Django的url解析

    Django中采用正则表达式来匹配所请求的url,这个叫做URLconf,作为MVC中的C(控制器), 这样再调用相应的试图,达到控制器控制试图的显示的效果. 看一下Django的url解析过程 第一 ...

  7. jsp页面获取参数的方法(url解析、el表达式赋值、session取值)【原创】

    最近使用myEclispse做网站,使用jsp+js+css做页面,网站中常用到从列表进入详情页面的跳转,下面对详情页面的值填充方式做一个简单总结: 1.url中使用request获取参数 jsp上方 ...

  8. 解决silk-v3-decoder-master转换wav时,百度语音解析问题

    $cur_dir/silk/decoder >& if [ ! -f "$1.pcm" ]; then /usr/local/ffmpeg/bin/ffmpeg -y ...

  9. 用正则把url解析为对象

    用正则把url解析为对象 <!DOCTYPE html><html><head><meta charset="utf-8">< ...

随机推荐

  1. php插入中文数据到MySQL乱码

    事情是这样的:我在本地的测试成功了,放到服务器测试,发现服务器的数据库里的中文竟然乱码了. 我进行了以下几步基本的做法: PHP文件改为utf-8的格式. 加入header("Content ...

  2. Error -26631: HTTP Status-Code=400 (Bad Request) for

    最近在做性能测试,在开发web脚本的过程中遇到错误:Action.c(15): Error -26631: HTTP Status-Code=400 (Bad Request) for http:// ...

  3. 群里提到的IE设置问题 ---B/S 下页面刷新问题

    这里面四个选项的含义 下面是每个选项的作用和意义: 1. “每次访问此页时检查”选项表示浏览器每次访问一个页面时,不管浏览器是否缓存过此页面,都要向服务器发出访问请求.这种设置的优点是实时性很强,肯定 ...

  4. UML实践详细经典教程

    面向对象的问题的处理的关键是建模问题.建模可以把在复杂世界的许多重要的细节给抽象出.许多建模工具封装了UML(也就是Unified Modeling Language™),这篇课程的目的是展示出UML ...

  5. Java NIO 详解(一)

    一.基本概念描述 1.1 I/O简介 I/O即输入输出,是计算机与外界世界的一个借口.IO操作的实际主题是操作系统.在java编程中,一般使用流的方式来处理IO,所有的IO都被视作是单个字节的移动,通 ...

  6. 用Python建设企业认证和权限控制平台

    目前大家对Python的了解更多来源是数据分析.AI.运维工具开发,在行业中使用Python进行web开发,同样也是非常受欢迎的,例如:FaceBook,豆瓣,知乎,饿了么等等,本文主要是介绍是利用P ...

  7. BZOJ 2226 [Spoj 5971] LCMSum 最大公约数之和 | 数论

    BZOJ 2226 [Spoj 5971] LCMSum 这道题和上一道题十分类似. \[\begin{align*} \sum_{i = 1}^{n}\operatorname{LCM}(i, n) ...

  8. eclipse/intellij idea 查看java源码和注释

    工作三年了,一直不知道怎么用IDE查看第三方jar包的源码和注释,惭愧啊!看源码还好些,itellij idea自带反编译器,eclipse装个插件即可,看注释就麻烦了,总不能去找api文档吧!现在终 ...

  9. bzoj2616: SPOJ PERIODNI——笛卡尔树+DP

    不连续的处理很麻烦 导致序列DP又找不到优秀的子问题 自底向上考虑? 建立小根堆笛卡尔树 每个点的意义是:高度是(自己-father)的横着的极大矩形 子问题具有递归的优秀性质 f[i][j]i为根子 ...

  10. Eclipse配置Maven的一些问题

    问题1:连接私服 build项目非常缓慢 配置好本地的setting文件后,发现build非常缓慢,照显示的进度,可能要一天才会build后一个项目,同事指导解决方法如下: MyEclipse2017 ...