Nginx防爬虫优化 Robots协议(也称为爬虫协议,机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取. 我理解的是robots.txt是通过代码控制搜索引擎蜘蛛索引的一个手段,以便减轻网站服务器的带宽使用率,从而让网站的空间更稳定,同时也可以提高网站其他页面的索引效率,提高网站收录. 我们只需要创建一个robots.txt文本文件,然后在文档内设置好代码,告诉搜索引擎我网站…
我们可以根据客户端的 user-agents 首部字段来阻止指定的爬虫爬取我们的网站: 虚拟主机配置如下:(红色标记为添加或者修改内容) [root@Nginx www_date]# cat brian.conf server { listen ; server_name www.brian.com; if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapart…
请求的处理流程 广域网上有大量的并发用户同时访问Web服务器,Web服务器传递请求给应用服务器(Web容器),Web容器传递请求给EJB容器,然后EJB容器发送数据库连接请求给数据库. 请求的处理流程--从连接池角度计算池大小--漏斗模型 http协议请求->Web服务器(1万+)->应用服务器(Web容器)(200)->EJB容器(80)->数据库(25) 注: 数值大小,仅做漏斗模型说明,不涉及具体大小设置 比如数据库连接池小于web线程池,默认的假定是:并非每个JSP和Ser…
目录 关于nginx.conf中的优化 配置nginx客户端网页缓存本地时间 nginx日志切割 nginx连接超时优化 Nginx 实现网页压缩功能 Nginx 实现防盗链功能 为目录添加访问控制 自定义nginx访问错误页面 nginx索引目录配置 nginx目录别名 nginx实现手机端和电脑端的分离网页 关于内核参数的优化: 关于 FastCGI 的几个指令: 后记: 关于nginx.conf中的优化 1.worker_processes 4; //nginx 进程数,建议按照 cpu…
  HTTP(Hypertext Transfer Protocol,超文本传输协议)是一种用于分布式.协作式和超媒体信息系统的 应用层协议.HTTP 是万维网的数据通信的基础.默认端口为 80.   设计 HTTP 最初的目的是为了提供一种发布和接收 HTML 页面的方法.通过 HTTP 或者 HTTPS 协议请求的资源由 URI(Uniform Resource Identifiers,统一资源标识符)来标识.其中最著名的是 1999 年 6 月公布的 RFC 2616,定义了 HTTP 协…
超文本传输协议(HTTP, HyperText Transfer Protocol)是一种无状态的协议,它位于OSI七层模型的传输层.HTTP客户端会根据需要构建合适的HTTP请求方法,而HTTP服务器会根据不同的HTTP请求方法做出不同的响应. 1. HTTP版本与HTTP请求方法 在HTTP的发展过程中,出现了很多HTTP版本,其中的大部分协议都是向下兼容的.在进行HTTP请求时,客户端在请求时会告诉服务器它采用的协议版本号,而服务器则会在使用相同或者更早的协议版本进行响应. HTTP/0.…
http请求中的8种请求方法 1.opions   返回服务器针对特定资源所支持的HTML请求方法   或web服务器发送*测试服务器功能(允许客户端查看服务器性能) 2.Get   向特定资源发出请求(请求指定页面信息,并返回实体主体) 3.Post   向指定资源提交数据进行处理请求(提交表单.上传文件),又可能导致新的资源的建立或原有资源的修改 4.Put   向指定资源位置上上传其最新内容(从客户端向服务器传送的数据取代指定文档的内容) 5.Head  与服务器索与get请求一致的相应,…
CASE函数   作用: 可以将查询结果集的某一列的字段值进行替换 它可以生成一个新列 相当于switch...case和 if..else 使用语法: case 表达式/字段 when 值 then 自定义值 else end as 别名 when 值 then:可以理解为当某个字段为某个值的时候,然后就返回自定义值将结果集的字段值进行替换 else:如果上面的when都不满足就执行else结果 常用用法一(case后面有字段或者表达式): when关键字后面写固定值 case关键字后面如果有…
HTTP请求方法:GET.HEAD.POST.PUT.DELETE.CONNECT.OPTIONS.TRACE 说明 平时的Rest开发,用到的都是GET,POST,PUT,DELETE类型的请求. 但Rest支持的请求类型不止前面4种,还有其他几种. 下面部分转自: https://www.html.cn/archives/9341 https://www.cnblogs.com/lnlvinso/p/11000568.html 超文本传输协议(HTTP, HyperText Transfer…
平时的Rest开发,用到的都是GET,POST,PUT,DELETE类型的请求. 但Rest支持的请求类型不止前面4种,还有其他几种. 下面部分转自: https://www.html.cn/archives/9341 超文本传输协议(HTTP, HyperText Transfer Protocol)是一种无状态的协议,它位于OSI七层模型的传输层.HTTP客户端会根据需要构建合适的HTTP请求方法,而HTTP服务器会根据不同的HTTP请求方法做出不同的响应. 1. HTTP版本与HTTP请求…