JAVA 获取网页流

package com.gethtmlContent;

import java.io.BufferedReader;

import java.io.InputStreamReader;

import java.net.HttpURLConnection;

import java.net.URL;

public class getHtmlContent {

    public static void main(String[] args) {

        System.getProperties().put("http.proxyHost", "xx.xx.xx.xx");// 代理服务器IP地址

        System.getProperties().put("http.proxyPort", "xxxx");// 代理服务器端口

        String url = "xxxxx";

        System.out.println(getHtmlConentByUrl(url));

    }

    public static String getHtmlConentByUrl(String ssourl) {

        try {

            URL url = new URL(ssourl);

            HttpURLConnection con = (HttpURLConnection) url.openConnection();

            con.setInstanceFollowRedirects(false);

            con.setUseCaches(false);

            con.setAllowUserInteraction(false);

            con.connect();

            StringBuffer sb = new StringBuffer();

            String line = "";

            BufferedReader URLinput = new BufferedReader(new InputStreamReader(con.getInputStream()));

            while ((line = URLinput.readLine()) != null) {

                sb.append(line);

            }

            con.disconnect();

            return sb.toString().toLowerCase();

        } catch (Exception e) {

            return null;

        }

    }

}

JAVA 获取网页流的更多相关文章

java获取文件流
CreateTime--2017年9月1日14:49:21 Author:Marydon servlet获取文件流的两种方式方式一:使用绝对路径(推荐使用) import java.io.Inp ...
java获取网页源码
获取网页的源码: package com.atguigu.crud.controller; import java.io.BufferedReader; import java.io.Buffered ...
java获取网页源代码并写入本地文件中
import java.io.*; import java.net.*; public class URLDemo { public static void main(String args[]){ ...
java 获取网页指定内容
import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; ...
JAVA 获取网页源代码保存到本地文件
package httpget; import java.io.BufferedReader; import java.io.File; import java.io.FileNotFoundExce ...
java 获取网页指定内容-2（实践+修改）
import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; ...
Java 网络爬虫获取网页源代码原理及实现
Java 网络爬虫获取网页源代码原理及实现 1.网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成.传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL ...
java根据URL获取网页编码
由于很多原因,我们要获取网页的编码(多半是写批量抓取的脚本吧...嘻嘻嘻) 注意: 如果你的目的是获取不乱码的网页内容(而不是根据网址发送post请求获取返回值),切记切记,移步这里 java根据UR ...
（java）Jsoup爬虫学习--获取网页所有的图片，链接和其他信息，并检查url和文本信息
Jsoup爬虫学习--获取网页所有的图片,链接和其他信息,并检查url和文本信息此例将页面图片和url全部输出,重点不太明确,可根据自己的需要输出和截取: import org.jsoup.Jsou ...

随机推荐

Linux线程同步：条件变量
条件变量通过允许线程阻塞和等待另一个线程发送信号的方法弥补了互斥锁的不足,它常和互斥锁一起使用.使用时,条件变量被用来阻塞一个线程,当条件不满足时,线程往往解开相应的互斥锁并等待条件发生变化.一旦其它 ...
为C#自定义控件添加自定义事件
这里的自定义控件是由普通控件组合而成的. 希望事件响应代码推迟到使用自定义控件的窗体里写. 步骤一:新建一个用户控件,放两个按钮,Tag分别是btn1,btn2. 这两个按钮的共用单击事件处理代码如下 ...
上个项目的一些反思 I
最近一直在反思之前的项目,发现了很多问题.比如数据安全... 虽然项目需求是只展示最新的数据,所以几乎没用什么本地存储.除了通讯录和用户的Token. 用户通讯录另表,今天反思下用户的Token的存储 ...
Nginx概念及基础安装--详细讲解
1.主要内容: Nginx的基础特性配置部署优化(了解) 2.Nginx 是什么? Nginx是一个开源的,支持高性能,高并发的www ...
数据库分库分表(sharding)系列(一) 拆分规则
第一部分:实施策略数据库分库分表(sharding)实施策略图解 1. 垂直切分垂直切分的依据原则是:将业务紧密,表间关联密切的表划分在一起,例如同一模块的表.结合已经准备好的数据库ER图或领域模型 ...
ios 抓取真机的网络包
一直被如何从真机上抓包所困扰!今天偶然看到了最简单有效的方法!分享一下: 原地址链接 http://blog.csdn.net/phunxm/article/details/38590561 通过 R ...
CCProxy二级代理上网设置
假如电脑A可以通过代理服务器上网,B电脑又可以连接A电脑,那么A电脑可以作为二级代理服务器进行上网,需要设置如下: 1.在A电脑上安装CCProxy,以v8.0为例 2.选择设置->高级 3.启 ...
ABAP 客户报表
*&---------------------------------------------------------------------* *& Report ZSDR014 ...
Scrapy003-项目流程
Scrapy003-项目流程 @(Spider)[POSTS] 前两篇文章我们了解到Scrapy的原理和安装的相关知识,这节就需要知道创建项目流程的小知识. 根据官方文档:http://scrapy- ...
网页Loading效果
问题描述:由于项目要求在页面提交以及加载的时候,有短暂的卡顿,需要用loading过渡. 1.下一个页面加载的时候实现: base-loading.js //获取浏览器页面可见高度和宽度 var _P ...

JAVA 获取网页流

JAVA 获取网页流的更多相关文章

随机推荐

热门专题