先来看看CSDN统计博客访问量的原理:

当客户端向服务器发起请求的时候,每个ip被统计一次,上图的三个客户端指的是三个不同的ip地址。并且在某段时间内,同以ip访问同一篇文章,只能算是一次访问量。同一ip在某个时间段内访问同一博客不同的文章,被访问到的文章次数+1。知道上诉简单的原理之后,接下来就想解决的办法了。

首先,准备一大批ip代理。一百度,嚯出来一大堆啊,这个年代雷锋还是挺多的,我选择了这家ip代理网站,并提供了api的调用接口,调用地址是:

http://www.xicidaili.com/api。

其次,引入我们需要的jar包,这里只需要一个jsoup包,千万别被jsoup这个名词吓到,下面我会贴出我的博客,说说这个哥们干嘛用的。

  1. jsoup-1.8.1.jar

接下来写一个封装ip类的java bean,其实不写bean也可以,直接放在String[]数组里面也是ok的,不过这样做的时候,代理调用的时候方便取出。

public class MyIp {

    private String address;

    private String port;

    public String getAddress() {
        return address;
    }

    public void setAddress(String address) {
        this.address = address;
    }

    public String getPort() {
        return port;
    }

    public void setPort(String port) {
        this.port = port;
    }
}

  现在主要用到的调用这个接口的工具是:jsoup,这个哥们我推荐看我的博客http://blog.csdn.net/zhang5476499/article/details/52205150。当然你也可以用httpClient等工具把网页的内容拿下来。用java 代码实现如下:

public static List<MyIp> getIp(String url) {
        List<MyIp> ipList = null;
        try {
            //1.向ip代理地址发起get请求,拿到代理的ip
            Document doc = Jsoup.connect(url)
              .userAgent("Mozilla")
              .cookie("auth", "token")
              .timeout(3000)
              .get();

            //2,将得到的ip地址解析除字符串
            String ipStr = doc.body().text().trim().toString();

            //3.用正则表达式去切割所有的ip
            String[] ips = ipStr.split("\\s+");

            //4.循环遍历得到的ip字符串,封装成MyIp的bean
            ipList = new ArrayList<MyIp>();
            for(final String ip : ips) {
                MyIp myIp = new MyIp();
                String[] temp = ip.split(":");
                myIp.setAddress(temp[0].trim());
                myIp.setPort(temp[1].trim());
                ipList.add(myIp);
            }
        } catch (IOException e) {
            System.out.println("加载文档出粗");
        }
        return ipList;
    }

  这里需要注意的是,api调用这个页面的 时候,使用的是get请求。好了,假设已经拿到了api给的100个代理的ip,那么,我们就可以设置代理了,设置代理的主要代码如下:

System.setProperty("http.maxRedirects", "50");
System.getProperties().setProperty("proxySet", "true");
System.getProperties().setProperty("http.proxyHost", myIp.getAddress());
System.getProperties().setProperty("http.proxyPort", myIp.getPort());

  下一步的工作是:循环这些拿到的代理ip,每设置一次代理,向博客地址发一次请求。

 public static void main(String[] args) {
         //1.想http代理地址api发起请求,获得想要的代理ip地址
         String url = "http://api.xicidaili.com/free2016.txt";
         List<MyIp> ipList = getIp(url);
         String blogUrl = "";
         Scanner sc = new Scanner(System.in);

         System.out.print("请输入文章地址:");
         blogUrl = sc.nextLine();
         System.out.print("请输入轮番刷新的倍数(x100):");
         int time = sc.nextInt();
         int count = 0;

         for(int i = 0; i< time; i++) {
             //2.设置ip代理
             for(final MyIp myIp : ipList) {
                 System.setProperty("http.maxRedirects", "50");
                 System.getProperties().setProperty("proxySet", "true");
                 System.getProperties().setProperty("http.proxyHost", myIp.getAddress());
                 System.getProperties().setProperty("http.proxyPort", myIp.getPort());

                 try {
                     Document doc = Jsoup.connect(blogUrl)
                                       .userAgent("Mozilla")
                                       .cookie("auth", "token")
                                       .timeout(3000)
                                       .get();
                     if(doc != null) {
                         count++;
                         logger.info("成功刷新次数: " + count);
                     }
                 } catch (IOException e) {
                     logger.error(myIp.getAddress() + ":" + myIp.getPort() + "报错");
                 }
             }
         }
     }
代理写到这差不多就结束了,其实刷流量也不需要多高深的技术,本文只是一个引子,希望能够祈祷抛砖引玉的作用。相关代码地址:http://download.csdn.net/detail/zhang5476499/9687448
 
--2016.11.27 14:08:30

JAVA刷CSDN博客流量的思路的更多相关文章

  1. 怎样统计分析CSDN博客流量

    第一.IP.PV和UV各自是什么意思? IP.实际上也就是指独立IP,它的英文为Internet ***otocol,是独立IP数的意思.00:00-24:00同样IP地址记录一次.即使你有多台电脑. ...

  2. 小老虎CSDN博客流量分析

    小老虎CSDN博客流量分析 一.分析的博客对象 http://blog.csdn.net/littletigerat 二.分析的时间节点 2014年7月10日星期四 三.PV.UV以及IP值   wa ...

  3. (最新)使用爬虫刷CSDN博客访问量——亲测有效

    说明:该篇博客是博主一字一码编写的,实属不易,请尊重原创,谢谢大家! 1.概述 前言:前两天刚写了第一篇博客https://blog.csdn.net/qq_41782425/article/deta ...

  4. JAVA爬虫挖取CSDN博客文章

    开门见山,看看这个教程的主要任务,就去csdn博客,挖取技术文章,我以<第一行代码–安卓>的作者为例,将他在csdn发表的额博客信息都挖取出来.因为郭神是我在大学期间比较崇拜的对象之一.他 ...

  5. Python爬取CSDN博客文章

    0 url :http://blog.csdn.net/youyou1543724847/article/details/52818339Redis一点基础的东西目录 1.基础底层数据结构 2.win ...

  6. 牛客网Java刷题知识点之TCP、UDP、TCP和UDP的区别、socket、TCP编程的客户端一般步骤、TCP编程的服务器端一般步骤、UDP编程的客户端一般步骤、UDP编程的服务器端一般步骤

    福利 => 每天都推送 欢迎大家,关注微信扫码并加入我的4个微信公众号:   大数据躺过的坑      Java从入门到架构师      人工智能躺过的坑         Java全栈大联盟   ...

  7. 牛客网Java刷题知识点之Map的两种取值方式keySet和entrySet、HashMap 、Hashtable、TreeMap、LinkedHashMap、ConcurrentHashMap 、WeakHashMap

    不多说,直接上干货! 这篇我是从整体出发去写的. 牛客网Java刷题知识点之Java 集合框架的构成.集合框架中的迭代器Iterator.集合框架中的集合接口Collection(List和Set). ...

  8. 牛客网Java刷题知识点之HashMap的实现原理、HashMap的存储结构、HashMap在JDK1.6、JDK1.7、JDK1.8之间的差异以及带来的性能影响

    不多说,直接上干货! 福利 => 每天都推送 欢迎大家,关注微信扫码并加入我的4个微信公众号:   大数据躺过的坑      Java从入门到架构师      人工智能躺过的坑          ...

  9. 梦想还是要有的-纪念正式成为csdn博客专家暨年中总结

    csdn博客:http://blog.csdn.net/tuzongxun 我的csdn历程(坚持总会有收获):   一年零三个月之前,2015年3月3日,我在csdn写下第一篇技术博客,只是记录了一 ...

随机推荐

  1. CSS3 模块

    CSS3 被划分为模块. 其中最重要的 CSS3 模块包括: 选择器 框模型 背景和边框 文本效果 2D/3D 转换 动画 多列布局 用户界面

  2. 后台运行进程(background job)

    在一些日常业务中,总有一些长时间处理的任务,系统运行这些任务需要一晚甚至一个周末. 这就需要后台运行单元(background work process)来完成,而且其是不会发生超时(time out ...

  3. Navicat for Oracle实现连接Oracle

    不知道为什么,从一开始,我就不喜欢Oracle,名字好听,功能强大,但总感觉"高不可攀";或许是因为我觉得其他的数据库就可以解决数据问题,不太了解Oracle的优势:而且它长得也不 ...

  4. Office 365 - SharePoint 2013 Online 中使用Windows PowerShell

    1.如果想要在SharePoint Online中使用Windows PowerShell,首先需要安装SharePoint Online Management Shell(下载地址附后),如下图: ...

  5. Sharepoint学习笔记—习题系列--70-576习题解析 -(Q13-Q15)

    Question 13 You are designing a SharePoint 2010 site. You need to design the site to meet all the fo ...

  6. web service上传参数代码实例

    web service上传参数代码实例 这次做的项目用到webservice比较多,最开始在网上看的参考dome,发现都不行,后来发现安卓4.0以后有很大的不同,在做传参时,有些东西需要注意: 第一, ...

  7. android Gui系统之SurfaceFlinger(5)---Vsync(2)

    9.Vsync第二部分 在上一篇中我们讲到,视图的刷新需要很多步骤, void SurfaceFlinger::handleMessageRefresh() { ATRACE_CALL(); preC ...

  8. #VSTS 日志# VSTS 所有功能,看这个页面就够了!

    随着Connect();//2015大会的结束,一大波的好消息随之而来.今天小编刚刚发现了Visual Studio Team Services / Team Foundation Server 的完 ...

  9. 【译】Java中的可变参数

    译文链接 http://www.programcreek.com/2014/01/java-varargs-examples/ 什么是Java可变参数 可变参数是Java 1.5引入的一个特性,它允许 ...

  10. Java AIO 异步IO应用实例

    项目地址:https://github.com/windwant/aio-test Server: package org.windwant.aio; import java.io.IOExcepti ...