猫宁!!!

参考链接:

https://www.freebuf.com/articles/network/169601.html

https://www.jianshu.com/p/f8062e2cc1d7

百度搜索高级语法很多,但在渗透测试中有效的语法也就10多个,它们通过自由组合,帮我们实现高效搜索目标。

相比语法,语法的应用场景更为关键,exp-db中的google hacking提供了大量的参考场景,给我们提供了多种多样的弹药。

https://www.exploit-db.com/google-hacking-database

能用百度演示,就不用了谷歌了,原因结尾说,不过别误解,和GFW没半毛钱关系。

双引号 "" ,英文双引号,锁定关键词

我试了一下百度,"百度网盘"加引号与不加引号搜索结果区别不大,借助谷歌。

不加引号,你看网页说明出,还有 百度 这个结果标红,搜索结果1.36亿条。

加引号,截图之外的网页说明处也都是标红 百度网盘 这个关键词,更精准,搜索结果3800万条。

加号,让搜索中尽可能出现加号之后的关键词,这个功能在谷歌和百度中都比较鸡肋。星号,英文的小点以及“~”用处同样不明显。搜索引擎高级语法本身也是区分可用性程度的。

百度 +网盘,百度 网盘,没有什么大的差别,虽然搜索结果上 百度 网盘 的结果是前者的2倍,但对用户没产生明显影响。

减号,让搜索中尽可能不出现减号之后的关键词

搜索百度会有 百度一下,结果1亿条。

采用减号,百度 -一下,可见效果还是比较显著的,截图之外也如此,结果也是1580万条,较少。

site语法,site:qq.com,可以看到很多腾讯公司的子域名,有助于腾讯公司域名资产的收集,对于其他域名是同样道理。

filetype语法,filetype:pdf,搜索出来的几乎全都是pdf文档,pdf也可以替代,例如ppt/doc/xls等文档类型均可,如果使用谷歌php/asp/action/aspx这种后缀也可以搜索。

cache语法,cache:www.pku.edu.cn,可以找到北京大学主页的缓存,但是需要用谷歌,百度不支持,缓存的是2天前的。

info语法,可以显示在标题,url,网页说明中的关键词信息,info:pku.edu.cn,可以看到很多的邮箱,子域名以及外链的信息,可以和别的语法先后使用,获取更多信息。

phonebook语法,phonebook:russia,可以显示俄罗斯的开源个人电话信息查询站点,可以认为是开源社工库,当然USA/UK等国家的也都可以找到。

 link,define,inanchor,datarange,related,music,movie,wheather等语法处境和加号类似,应用场景不是很多,可用性较差,但并不代表它们是没用的,只是在渗透测试信息收集中作用不明显。

接下来介绍的是很重要的6个语法。

intitle语法,intitle:后台,这个时候会发现能看到很多的后台站点出现,而在站点标题无疑都有后台这个字眼,当然换成别的词汇或者英文都是可以的。

allintitle语法,allintitle:后台 登录,标题中尽可能显示后台和登录两个关键词。

intitle:后台 intitle:登录 ,可以搜到更多结果,而且在中文字符上百度远好过谷歌,谷歌对于显示的页数有限制,只能查看20个页面的结果。

intitle:后台 登录,则表示标题一定要有后台,但是 登录 可以出现在网页说明中。

不过实际上,搜索语法与最终显示结果并不是绝对的,只能说不同的语法更倾向于某种搜索结果。

能用intitle最好不选用allintitle。

 intext语法,intext:百度,因为百度不明显,这个用谷歌展示,在网页说明中会出现 百度 这个关键词的字眼。

allintext语法,allintext:百度 周鸿祎,在网页说明中有百度 周鸿祎 两个关键词同时出现。allintext:周鸿祎 百度,两个关键词调转位置,结果基本一样。

inurl语法,inurl:admin,在网页URL中一定含有admin这个关键词,administrator也是包含admin的,一般这样的站点多是后台。

allinurl语法,allinurl:admin login,在URL中含有admin,login,百度表现不明显,用谷歌展示出来。

现在说一些组合语法

intitle:index.of,其中的点表示一个单字符,index.of出现在标题中,打开第一个链接,这种类型目录可以发现很多。

 intext:"the WordPress" inurl:wp-config ext:txt,网页说明精准含有the WordPress这个关键词,url中含有wp-config,链接的文件扩展名是txt文件,包含对方的配置文件信息。

 intitle: "Index of" intext:log,在网页标题中精准含有Index of,网页说明中含有log关键词,获取一些日志类文件。

 site:com inurl:jboss filetype:log -github.com,站点一定是com的,url中含有jboss,文件类型是log,并且不能是来自github。

filetype:mdb inurl:com,文件类型是mdb的数据库文件,url中含有com,可以获取大量的数据库文件。

这里就用5个例子说明一下,场景一方面是参考他人案例,另外自己也需要根据实践,采用适合的组合拳。

搜索引擎高级语法需要掌握,搜索引擎直接提供的高级搜索框也应该熟悉里面各个选项的用途,在实际使用中也许更高效。

这是谷歌的高级搜索框,还有一大堆的解释说明,比较贴心。

还有搜索框工具,可以快速调节时间还有结果类型,verbatim是精准匹配的意思。

这是百度的高级搜索框,相比谷歌少了语言和地区选项,其他基本一样,倒是显得简约不少。

百度的搜索框工具倒是更齐全,除了时间还有文件类型,以及站点锁定功能,即使日常用起来也可以带来不少便利。

谷歌作为一个全球性搜索引擎,在爬取全球各国各地区网页上不遗余力,百度主要够专注于中国市场,在中文搜索上还是要略胜一筹,百度自建的这个生态可谓相当重要,例如百度百科,百度知道,百度文档等,因此在搜索国内站点时,谷歌百度结合使用会更好,而且谷歌对于频繁访问的行为还进行人机识别,但是国内访问百度还没有遇到过。

此外在国内,除去百度其他搜索也有自己的特色。

搜狗搜索,其中的搜狗微信和搜狗知乎是百度所欠缺的,也是搜狗独有特色,目前微信APP搜索功能显示结果很多就是搜狗的结果。

https://www.sogou.com/

微软必应搜索,目前国内的搜狗英文还有360英文搜索采用的都是必应提供技术支持,国外的雅虎搜索,除去雅虎日本外,也是完全由必应提供搜索技术支撑,必应学术在搜索英文文献上比百度好很多,可以一定程度替代谷歌。即使在国内如果搜索英文技术文章,使用必应国际版,也是很好的。

https://cn.bing.com

国内还有的神马搜索,只做移动端;360搜索,靠360浏览器、360导航、360安全卫士引流量;中国搜索,号称搜索引擎国家队。这几个很多搜索引擎高级语法都不怎么支持。

选择百度来演示,并不是说百度比谷歌好,而是为了说百度有自己天然的本土优势,对中国站点信息收集,绝对不能轻视。

目前掌握搜索引擎核心技术的国家有4个,中国,美国,俄罗斯,韩国。

俄罗斯的yandex是独联体国家市场份额最大的一家,如同百度在中国地位,在site收集国内站点子域名的时候,可以给你带来意想不到的收获,不过也有人机识别认证,如果收集俄语信息,yandex是你绕不开的一个,此外俄罗斯的mail.ru搜索也占据较大市场,主营社交软件、邮箱和视频业务,主要做俄语搜索。

yandex英文版

mail.ru俄语版

https://mail.ru/

韩国人的第一大搜索引擎同样不是谷歌,而是Naver搜索,而且该公司是著名社交软件Line的开发者,朝鲜语的搜索领域也是不可或缺的。

国外的一个号称隐私保护搜索站点DuckDuckGo搜索千万不要错过,尤其是对于注重隐私的人,每次访问这个网站就相当于第一次访问,它们的盈利手段是基于关键词来展示广告,而不是跟踪分析你的喜好来展现。

DuckDuckGo,打开直接显示中文,对于隐私保护,我有点质疑。

https://duckduckgo.com

美国人的一个手册,google hacking:渗透测试者的利剑,对谷歌搜索语法进行了详尽分析,京东有售中文翻译版。

这里有一个PPT版的,而且是书的作者早年做的。

http://www.mrjoeyjohnson.com/Google.Hacking.Filters.pdf

防止信息泄露和服务器入侵的措施:(来自freebuf-K0rz3n)

1.检查所有的文档能否被Google搜索到,避免敏感文件能出现在公众的视野中

2.选择一个强大的自动化工具来扫描你网站上是否有信息的泄露

3.不要使用默认的登录入口,以防止登录入口被hacker猜解

4.关闭数据库的远程管理工具

5.删除明显的显示软件版本的信息

6.配置服务器只能下载特定的文件类型(白名单比黑名单要简单有效得多)

7.正确的配置你的服务器,不要抱有侥幸心理,任何的松懈带来的灾难是巨大的

8.不要把源码的备份放在未经授权就能访问的地方,并且及时删除网站上的无用的备份文件

9.不要使用弱密码,防止攻击者轻易攻破后台

10.登录请加上强度相对较高的验证手段,防止攻击者采用爆破的手段

11.关闭服务器不必要的端口

12.请不要使用网站上的任何信息作为密码,否则都属于容易爆破的类型

13.备份的源代码请经过专业的混淆,防止被下载之后轻易读取到内容

14.及时更新服务器的系统,修复潜在的漏洞

15.安装正规的安全防护软件

破除一个误解,千万不要以为常规搜索引擎就可以覆盖大部分,不是如此,淘宝,京东,亚马逊,wikihow,以及一些垂直的专业类站点都是很重要的信息获取途径,现在这个时代信息很多,这也造成了更多的信息鸿沟和信息壁垒,人与人之间的信息不对等反而愈发扩大,如何高效获取有效且专业及时的信息,显得尤为必要。

PJzhang:搜索引擎高级语法与渗透测试的更多相关文章

  1. Kail Linux渗透测试教程之ARP侦查Netdiscover端口扫描Zenmap与黑暗搜索引擎Shodan

    Kail Linux渗透测试教程之ARP侦查Netdiscover端口扫描Zenmap与黑暗搜索引擎Shodan ARP侦查工具——Netdiscover Netdiscover是一个主动/被动的AR ...

  2. 渗透测试工具Nmap从初级到高级使用教程

    本文由阿德马翻译自国外网站,请尊重劳动成果,转载请注明出处,谢谢 Nmap是一款网络扫描和主机检测的非常有用的工具.Nmap是不局限于仅仅收集信息和枚举,同时可以用来作为一个漏洞探测器或安全扫描器.它 ...

  3. 渗透测试工具Nmap从初级到高级

    Nmap是一款网络扫描和主机检测的非常有用的工具. Nmap是不局限于仅仅收集信息和枚举,同时可以用来作为一个漏洞探测器或安全扫描器.它可以适用于winodws,linux,mac等操作系统.Nmap ...

  4. PJzhang:漏洞渗透测试框架“天使之剑(AngelSword)”

    猫宁!!! 参考链接: www.phpinfo.cc/?post=42 https://www.freebuf.com/sectool/149883.html 同事介绍了一款渗透测试框架AngelSw ...

  5. PJzhang:Firefox渗透测试插件HackTools样例

    猫宁~~~ firefox插件hacktools地址: https://addons.mozilla.org/zh-CN/firefox/addon/hacktools/ HackTools由Ludo ...

  6. 《Metasploit渗透测试魔鬼训练营》第一章读书笔记

    第1章 魔鬼训练营--初识Metasploit 20135301 1.1 什么是渗透测试 1.1.1 渗透测试的起源与定义 如果大家对军事感兴趣,会知道各国军队每年都会组织一些军事演习来锻炼军队的攻防 ...

  7. 专为渗透测试人员设计的 Python 工具大合集

    如果你对漏洞挖掘.逆向工程分析或渗透测试感兴趣的话,我第一个要推荐给你的就是Python编程语言.Python不仅语法简单上手容易,而且它还有大量功能强大的库和程序可供我们使用.在这篇文章中,我们会给 ...

  8. SEO站长必备的十大常用搜索引擎高级指令

    作为一个seo人员,不懂得必要的搜索引擎高级指令,不是一个合格的seo.网站优化技术配合一些搜索引擎高级指令将使得优化工作变得简单.今日就和大家聊聊SEO站长必备的十大常用搜索引擎高级指令的那些事儿. ...

  9. 零基础到精通Web渗透测试的学习路线

    小编相信很多新手都会遇到以下几个问题 1.零基础想学渗透怎么入手? 2.学习web渗透需要从哪里开始? 这让很多同学都处于迷茫状态而迟迟不下手,小编就在此贴给大家说一下web渗透的学习路线,希望对大家 ...

随机推荐

  1. 《CSS权威指南(第三版)》---第一章 CSS和文档

    主要学习的知识是怎么把CSS和HTML文档关联: 1.这是默认的样式表 <link rel="stylesheet" href="" type=" ...

  2. DOM的构建与优化

    一.构建模块 HTML描述了一个页面的结构.浏览器会将它转换成一种他们能够理解的格式——文档对象模型(DOM),浏览器引擎有一段特殊的代码叫做解析器,将数据从一种格式转换成另外一种格式. 一个HTML ...

  3. POJ2104 K-th Number —— 区间第k小 整体二分

    题目链接:https://vjudge.net/problem/POJ-2104 K-th Number Time Limit: 20000MS   Memory Limit: 65536K Tota ...

  4. ELK之方便的日志收集、搜索、展示工具

    大家在做分部署系统开发的时候是不是经常因为查找日志而头疼,因为各服务器各应用都有自己日志,但比较分散,查找起来也比较麻烦,今天就给大家推荐一整套方便的工具ELK,ELK是Elastic公司开发的一整套 ...

  5. RQNOJ 188 购物问题:树形dp

    题目链接:https://www.rqnoj.cn/problem/188 题意: 商场以超低价格出售n个商品,购买第i个商品所节省的金额为w[i]. 为了防止亏本,有m对商品是不能同时买的.但保证商 ...

  6. html5--2.1新的布局元素概述

    html5--2.1新的布局元素概述 学习要点 了解HTML5新标签(元素)的优点 了解本章要学习的新的布局元素 了解本章课程的安排 HTML5新标签的优点: 更注重于内容而不是形式 对人的友好:更加 ...

  7. 勤于思考:jQuery Validation 在IE7(兼容模式)下出现“找不到成员”的脚本错误

    今天在调试IE10下使用IE6判断脚本出现错误,处理后说IE7也不行,调试后则会出现以下错误: SCRIPT3: 找不到成员. jquery171.js, 行2582 字符4 其实开始我认为是jque ...

  8. storm源码剖析(3):topology启动过程

    storm的topology启动过程是执行strom jar topology1.jar MAINCLASS ARG1 ARG2 鉴于前面已经分析了脚本的解析过程,现在重点分析topology1.ja ...

  9. codeforces 587B B. Duff in Beach(dp)

    题目链接: B. Duff in Beach time limit per test 2 seconds memory limit per test 256 megabytes input stand ...

  10. 解决系统存在大量TIME_WAIT状态的连接

    系统存在大量TIME_WAIT状态的连接,通过调整内核参数解决, vi /etc/sysctl.conf 编辑文件,加入以下内容:net.ipv4.tcp_syncookies = 1net.ipv4 ...