httpclient使用连接池

http协议是无状态的,但毕竟是基于tcp的,底层还是需要和服务器连接的,
对于需要从同一个站点抓取大量网页的程序,应该使用连接池,否则每次抓取都和web站点建立连接,发送请求,获得响应,释放连接.
一方面效率不高
一方面不小心就会疏忽某些资源的释放,导致站点拒绝连接(很多站点会拒绝大量连接,防止Dos攻击)

httpclient连接池

httpclient从4.2版本开始抛弃了先前的
SingleClientClientConnManger和ThreadSafeConnManger取而代之的是BasicClientConnectionManger和PoolingClientConnectionManager
BasicClientConnectionManager
该类内部只维护了一个活动的connection,尽管这个类是线程安全的,但是最好在一个单独的线程中重复使用它。
如果在同一个BasicClientConnectionManager对象中,
* 多次请求与先前请求时同一个route,那么BasicClientConnectManager会使用同一个连接完成后续请求,
*否则,BasicClientConnectionManager会将先前的connection关闭,然后为后续请求创建一个新的连接。
也就是说BasicClientConnectionManager会尽量使用同一个BasicClientConnectionManager完成
PoolClientConnectionManager
该类可以在多个线程中使用,连接按照route被缓存(pooled),当后续请求route请求已经在pool中存在,就会使用pool中先前使用的connection获取请求。
PoolClientonnectionManager对每个route维护的connection数目有上限要求,
默认每个route最多维护两个并发线程的connection连接,
整个pool最多容纳20个并发connection。(可以通过设置来修改这些限制)

BasicClientConnectionManager

public static void basicClientTest() throws Exception{
 HttpClient httpclient = new DefaultHttpClient();
 HttpGet httpGet = new HttpGet("http://m.weather.com.cn/data/101010100.html");
 HttpResponse response=httpClient.execute(httpGet);
 String result = EntityUtils.toString(response.getEntity(),charset.forName("utf-8"));
 System.out.println(result);
 httpClient.getConnectionManager().shutdowm();
}
PoolingClientConnectionManager
SchemeRegistry schemeRegistry = new SChemeRegistry();
schemeRegistry.register(new Scheme("http",80,PlainSocketFactory.getSocketFactory()));
schemeRegistry.register(new Scheme("https",443,SSLSocketFactory.getSocketFactory()));

HttpHost baidu = new HttpHost("www.baidu.com",80);
HttpHost local = new HttpHost("127.0.0.1",8090);

PoolingClientConnectionManager cm = new PoolingClientConnectionManager(schemeRegistry);
cm.setMaxPerRoute(new HttpRoute(baidu),30);
cm.setMaxPerRoute(new HttpRoute(local),50);

连接池使用总结

1) 首先配置最大连接数和最大路由连接数,如果连接的url只有一个,两个必须配置成一样,否则只会去最小值
(默认最大连接数是20,每个路由最大连接是2)

2) 最好配置httpclient的等待时间和响应时间.否则就会一直等待
HttpParams httpparams = new BasicHttpParams();
httpparams.setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT,CONNECT_TIMEOUT);
httpparams.setParameter(CoreConnectionPNames.SO_TIMEOUT,READ_TIMEOUT);

3) httpClient必须releaseConnection,但不是abort。因为releaseconnection是归还连接到到连接池,而abort是直接抛弃这个连接,
而且占用连接池的数目。
HttpGet httpget = new HttpGet(url);
httpGet.releaseConnection();

4) httpclient设置的最大连接数绝对不能操作tomcat设置的最大连接数,否则tomcat的连接就会被httpclient连接池一直占用,直到系统挂掉。

5) 可以使用tomcat的长连接和httpclient连接池和合理使用来增加系统响应速度
cm.setMaxTotal(200);//创建socket的上线是200
cm.setDefaultMaxPerRoute(20);//默认对每个指定连接的服务器(指定的ip)可以创建并发20socket进行访问

httpclient httpclient使用连接池的更多相关文章

  1. HttpClient 4.3连接池参数配置及源码解读

    目前所在公司使用HttpClient 4.3.3版本发送Rest请求,调用接口.最近出现了调用查询接口服务慢的生产问题,在排查整个调用链可能存在的问题时(从客户端发起Http请求->ESB-&g ...

  2. springboot使用RestTemplate+httpclient连接池发送http消息

    简介 RestTemplate是spring支持的一个请求http rest服务的模板对象,性质上有点像jdbcTemplate RestTemplate底层还是使用的httpclient(org.a ...

  3. HttpClient4.5.2 连接池原理及注意事项

    随着微服务的流行,服务之间的http调用越来越多,遇到的问题也比较多,写这边文章的目的也是将自己遇到的坑和解决方案跟大家分享 一.为什么要用Http连接池 1.降低延迟:如果不采用连接池,每次连接发起 ...

  4. spring-boot RestTemplate 连接池

    以前我们项目都是基于Apache HttpClient 连接池进行web 接口调用,后来用spring-boot, 发现 RestTemplate 挺好用. 简单介绍下: 什么是RestTemplat ...

  5. RestTemplate连接池(转载)

    出处:http://zhangzhi19861216.cnblogs.com/ spring-boot RestTemplate 连接池 以前我们项目都是基于Apache HttpClient 连接池 ...

  6. HttpClient连接池的连接保持、超时和失效机制

    HTTP是一种无连接的事务协议,底层使用的还是TCP,连接池复用的就是TCP连接,目的就是在一个TCP连接上进行多次的HTTP请求从而提高性能.每次HTTP请求结束的时候,HttpClient会判断连 ...

  7. HttpClient连接池抛出大量ConnectionPoolTimeoutException: Timeout waiting for connection异常排查

    转自: http://blog.csdn.net/shootyou/article/details/6615051 今天解决了一个HttpClient的异常,汗啊,一个HttpClient使用稍有不慎 ...

  8. Http持久连接与HttpClient连接池

    一.背景 HTTP协议是无状态的协议,即每一次请求都是互相独立的.因此它的最初实现是,每一个http请求都会打开一个tcp socket连接,当交互完毕后会关闭这个连接. HTTP协议是全双工的协议, ...

  9. Http 持久连接与 HttpClient 连接池

    一.背景 HTTP协议是无状态的协议,即每一次请求都是互相独立的.因此它的最初实现是,每一个http请求都会打开一个tcp socket连接,当交互完毕后会关闭这个连接. HTTP协议是全双工的协议, ...

  10. HttpClient官方sample代码的深入分析(连接池)

    前言   之前一直使用apache的httpclient(4.5.x), 进行http的交互处理. 而httpclient实例则使用了http连接池, 而一旦涉及到连接池, 那会不会在使用上有些隐藏很 ...

随机推荐

  1. hdu 2222 Keywords Search - Aho-Corasick自动机

    Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submissio ...

  2. tomcat部署项目如何去掉项目名称

    去掉项目名和端口: 首先,进入tomcat的安装目录下的conf目录,我的目录是 /usr/local/apache-tomcat-6.0.20/conf,编辑文件server.xml. 1.去除端口 ...

  3. Effective TensorFlow Chapter 4: TensorFlow中的广播Broadcast机制【转】

    本文转载自:https://blog.csdn.net/LoseInVain/article/details/78763303 TensorFlow支持广播机制(Broadcast),可以广播元素间操 ...

  4. 主引导记录MBR的结构和作用

    MBR磁盘分区都有一个引导扇区,称为主引导记录,英文简称为MBR.1. MBR的结构MBR扇区位于整个硬盘的第一个扇区:按照C/H/S地址描述,即0柱面〇磁头1扇 区:按照LBA地址描述即0扇区.它是 ...

  5. SQL 收集

    1.union CREATE TABLE dbo.#testTab ( Id int NOT NULL ) insert into #testTab values(); insert into #te ...

  6. vuejs全局api概念

    什么是全局API? 全局API并不在构造器里,而是先声明全局变量或者直接在Vue上定义一些新功能,Vue内置了一些全局API,比如我们今天要学习的指令Vue.directive.说的简单些就是,在构造 ...

  7. grpc python quickstart

    参考:grpc python quickstart 准备 1.升级pip $ python -m pip install --upgrade pip 2.安装grpc $ python -m pip ...

  8. NS3 实验脚本的编写步骤

    第一步:配置主机,安装模块 (1)创建N个节点: NodeContainer nodes; nodes.Creat(N); 比如我目前接触到的PointToPoint,N就是2 (2)利用拓扑助手He ...

  9. 提高Intellij创建Maven工程的速度

    按照默认的方式创建Maven工程的时候会发现Maven插件加载的很慢如下 解决方法:在创建的过程中,在Properties中添加一个参数archetypeCatalog=internal . 因为ar ...

  10. Python四大主流网络编程框架

    目前的4种主流Python网络框架:Django.Tornado.Flask.Twisted.