通过httpClient设置代理Ip

背景：

　　我们有个车管系统，需要定期的去查询车辆的违章，之前一直是调第三方接口去查，后面发现数据不准确（和深圳交警查的对不上），问题比较多。于是想干脆直接从深圳交警上查，那不就不会出问题了吗，但是问题又来了，因为车比较多，一次查的数据量很大，如果同时间段大批量请求深圳交警可能会导致ip被他们那边封禁，那有什么解决办法呢？

解决方案：

　　网上查了很多资料，大致讲的就是设置代理ip，然后通过代理ip去访问。

设置代理ip：

　　设置代理ip的方式有很多种，我这里讲其中一种，通过httpClient设置代理Ip，httpClient我想大家都不陌生了吧，它几乎封装了所有的http请求方法，当然其中也提供了设置代理ip的方法，废话不多说，直接上代码。

@Test
public void test() throws Exception{
    //创建httpClient实例
    CloseableHttpClient httpClient = HttpClients.createDefault();
    //创建httpGet实例
    HttpPost httpPost = new HttpPost("请求地址");
    //设置代理IP，设置连接超时时间 、 设置 请求读取数据的超时时间 、 设置从connect Manager获取Connection超时时间、
    HttpHost proxy = new HttpHost("125.77.49.244", 808);

    List<NameValuePair> params = new ArrayList<NameValuePair>();   //设置请求参数
    params.add(new BasicNameValuePair("car_number", "粤B123456"));
    params.add(new BasicNameValuePair("licensePlateNo", "粤B123456"));

    HttpEntity entitys = new UrlEncodedFormEntity(params, "UTF-8");

    RequestConfig requestConfig = RequestConfig.custom()
            .setProxy(proxy)
            .setConnectTimeout(10000)
            .setSocketTimeout(10000)
            .setConnectionRequestTimeout(3000)
            .build();
    httpPost.setConfig(requestConfig);
    httpPost.setEntity(entitys);
    //设置请求头消息
    httpPost.setHeader("User-Agent", "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:50.0) Gecko/20100101 Firefox/50.0");

    CloseableHttpResponse response = httpClient.execute(httpPost);
    if (response != null){
        HttpEntity entity = response.getEntity();  //获取返回实体
        if (entity != null){
            System.out.println("网页内容为:"+ EntityUtils.toString(entity,"utf-8"));
        }
    }
    if (response != null){
        response.close();
    }
    if (httpClient != null){
        httpClient.close();
    }
}

这里讲一下另外一种设置代理ip的方案，直接上代码

@Test
public void test3() throws Exception{
    System.getProperties().setProperty("proxySet","true");
    System.getProperties().setProperty("http.proxyHost","60.191.201.38"); //设置ip
    System.getProperties().setProperty("http.proxyPort","45461");　　　　//设置端口号

    Document cocument = Jsoup.connect("http://127.0.0.1:8082/newAtb/indexData.do").ignoreContentType(true).post();
}

至于代理ip，有很多种获取方式，大部分需要花钱买，免费的很少，这里给大家一个网站 http://www.xicidaili.com/，这个网站每天都会更新免费的代理ip，我们可以定期去上面爬取数据到本地供我们使用，这里贴上一段本人爬取ip的代码

public  void setProxyIpList(){
    try {
        String rLine;
        URL url = new URL("http://www.xicidaili.com/");
        URLConnection conn = url.openConnection();
        conn.setRequestProperty("User-Agent","Mozilla/4.0 (compatible; MSIE 7.0; NT 5.1; GTB5; .NET CLR 2.0.50727; CIBA)");
        List<String> list = new ArrayList<>();
        InputStreamReader inputStreamReader = new InputStreamReader(conn.getInputStream(),"utf-8");
        BufferedReader bufferedReader = new BufferedReader(inputStreamReader);
        int a = 0;
        do{
            rLine = bufferedReader.readLine();
            String reg1 = "\\d+";                         //匹配端口号
            String reg = "\\d+\\.\\d+\\.\\d+\\.\\d+";  //匹配ip
            if(rLine.contains("<td>") ) {
                rLine = rLine.substring(rLine.indexOf("<td>") + 4, rLine.indexOf("</td>"));
                if (Pattern.matches(reg, rLine) || Pattern.matches(reg1, rLine)) {
                    list.add(rLine);
                    a++;
                }
            }
        }while (a !=40);

        for (int i=0; i< list.size();i=i+2 ) {
            IPort ip = new IPort();
            ip.setIp(list.get(i));
            ip.setPort(Integer.parseInt(list.get(i+1)));
            listPort.add(ip);
        }

    } catch (Exception e) {
        e.printStackTrace();
        logger.info("拉取代理ip异常:" + e.getMessage());
    }
}

通过httpClient设置代理Ip的更多相关文章

解决httpclient设置代理ip之后请求无响应的问题
httpclient这个工具类对于大家来说应该都不陌生吧,最近在使用过程中出现了碰到一个棘手的问题,当请求的接口地址由http变成https之后,程序执行到 httpClient.execute(ht ...
HttpClient使用代理IP
在爬取网页的时候,有的网站会有反爬虫措施,导致服务器请求拒接,可以使用代理IP来访问,解决请求拒绝的问题代理IP分透明代理.匿名代理.混淆代理.高匿代理 1.透明代理(Transparent Pr ...
（四）HttpClient 使用代理 IP
第一节: HttpClient 使用代理 IP 在爬取网页的时候,有的目标站点有反爬虫机制,对于频繁访问站点以及规则性访问站点的行为,会采集屏蔽IP措施. 这时候,代理IP就派上用场了. 关于代理IP ...
爬虫-设置代理ip
1.为什么要设置代理ip 在学习Python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败.高强度.高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网 ...
Python爬虫之利用BeautifulSoup爬取豆瓣小说（一）——设置代理IP
自己写了一个爬虫爬取豆瓣小说,后来为了应对请求不到数据,增加了请求的头部信息headers,为了应对豆瓣服务器的反爬虫机制:防止请求频率过快而造成“403 forbidden”,乃至封禁本机ip的情况 ...
Python爬虫常用小技巧之设置代理IP
设置代理IP的原因我们在使用Python爬虫爬取一个网站时,通常会频繁访问该网站.假如一个网站它会检测某一段时间某个IP的访问次数,如果访问次数过多,它会禁止你的访问.所以你可以设置一些代理服务器来 ...
python3 selenium模块Chrome设置代理ip的实现
python3 selenium模块Chrome设置代理ip的实现 selenium模块Chrome设置代理ip的实现代码: from selenium import webdriver chrome ...
scrapy框架设置代理ip，headers头和cookies
[设置代理ip] 根据最新的scrapy官方文档,scrapy爬虫框架的代理配置有以下两种方法: 一.使用中间件DownloaderMiddleware进行配置使用Scrapy默认方法scrapy s ...
HttpClient 设置代理方式
HttpClient httpClient = new HttpClient(); //设置代理服务器的ip地址和端口 httpClient.getHostConfiguration().setPro ...

随机推荐

java throw和catch同时使用
当异常出现在当前方法中,程序只对异常进行部分处理,还有一些处理需要在方法的调用者中才能处理完成,此时还应该再次抛出异常,这样就可以让方法的调用者也能捕获到异常; Eg: public static ...
Python--day31--黏包(不熟...)
Codeforces Round #194 (Div.1 + Div. 2)
A. Candy Bags 总糖果数\(\frac{n^2(n^2+1)}{2}\),所以每人的数量为\(\frac{n}{2}(n^2+1)\) \(n\)是偶数. B. Eight Point S ...
php 变量名前加一个下划线含义
https://segmentfault.com/q/1010000006467833 一个下划线是私有变量以及私有方法两个下划线是PHP内置变量. 以下划线开头,表示为类的私有成员. 这只是个不成文 ...
CentOS7 添加FTP用户并设置权限
step 1 安装配置Vsftp服务器一.配置防火墙,开启FTP服务器需要的端口 CentOS 7.0默认使用的是firewall作为防火墙,这里改为iptables防火墙. 1.关闭firewal ...
Python--day38--进程同步控制的---锁\信号量\事件的方法名
P1035 台阶问题二
题目描述有 \(N\) 级的台阶,你一开始在底部,每次可以向上迈最多 \(K\) 级台阶(最少 \(1\) 级),问到达第 \(N\) 级台阶有多少种不同方式. 输入格式两个正整数 \(N, K( ...
P1009 字符三角形
题目描述输入一个字符c,按照阳历输出的格式输出由该字符组成的一个字符三角形. 输入格式输入包含一个字符c. 输出格式输出由该字符c组成的字符三角形. 样例输入 A 样例输出 A AAA AAAA ...
Spring Boot Admin-应用健康监控后台管理
Spring Boot Admin 用于监控基于 Spring Boot 的应用,它是在 Spring Boot Actuator 的基础上提供简洁的可视化 WEB UI. 1. 什么是Spring ...
【t050】方程求解
Time Limit: 1 second Memory Limit: 128 MB [问题描述] 要求Xi(i = 1,2,3,4)是一个[-T..T]中的整数,满足方程AX1 + BX2 + CX3 ...

通过httpClient设置代理Ip

通过httpClient设置代理Ip的更多相关文章

随机推荐

热门专题