使用jdk获取网页

参考：https://www.zhihu.com/question/30626103

由于例子比较老了，现在的百度抓不到完整的页面了

import java.io.BufferedReader;

import java.io.InputStreamReader;

import java.net.URL;

import java.net.URLConnection;

public class Main {

    public static void main(String[] args) {

        String url = "https://www.baidu.com/";

        String result = "";

        // 定义一个缓冲字符输入流

        BufferedReader in = null;

        try {

            // 将String转化成url对象

            URL realUrl = new URL(url);

            // 初始化一个链接到那个url

            URLConnection connection = realUrl.openConnection();

            // 开始实际的连接

            connection.connect();

            // 初始化bufferedReader输入流来读取URL的相应

            in = new BufferedReader(new InputStreamReader(

                    connection.getInputStream()));

            // 用来临时存储抓取到的每一行数据

            String line;

            while ((line = in.readLine()) != null) {

                // 遍历抓取到的每一行并存储到result里面

                result += line + "\n";

            }

        } catch (Exception e) {

            System.out.println("发送GET请求出现异常！" + e);

            e.printStackTrace();

        } finally {

            try {

                if (in != null) {

                    in.close();

                }

            } catch (Exception e2) {

                // TODO: handle exception

            }

        }

        System.out.println(result);

    }

}

使用jdk获取网页的更多相关文章

telnet建立http连接获取网页HTML内容
利用telnet可以与服务器建立http连接,获取网页,实现浏览器的功能.它对于需要对http header进行观察和测试到时候非常方便.因为浏览器看不到http header. 步骤如下: 1. 运 ...
C#获取网页的HTML码、下载网站图片、获取IP地址
1.根据URL请求获取页面HTML代码 /// <summary> /// 获取网页的HTML码 /// </summary> /// <param name=" ...
Java 网络爬虫获取网页源代码原理及实现
Java 网络爬虫获取网页源代码原理及实现 1.网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成.传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL ...
c#利用WebClient和WebRequest获取网页源代码的比较
前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...
【转】如何在Windows+VS2005使用最新静态libcurl 7.35.0获取网页数据，支持HTTPS
地址: http://blog.csdn.net/hujkay作者:Jekkay Hu(34538980@qq.com)关键词:Windows,curl,ssl, visual c++ 2005, ...
C语言之socket获取网页源码
写爬虫也许你用的是python,类似urlopen(url).read()即可获得普通的网页的源码,或者用的java的网络库加上流操作,或者其他高级语言.但你有没有想过使用C语言来实现呢?我曾经以为用 ...
WebRequest 获取网页乱码
问题:在用WebRequest获取网页源码时得到的源码是乱码. 原因:1,编码不对解决办法:设置对应编码 WebRequest request = WebRequest.Create(Url);We ...
php正则获取网页标题、关键字、网页描述代码
php正则获取网页关键字,代码如下: function get_keywords($html) { $html=strtolower($html); preg_match("@<hea ...
C# HttpWebRequest 绝技根据URL地址获取网页信息
如果要使用中间的方法的话,可以访问我的帮助类完全免费开源:C# HttpHelper,帮助类,真正的Httprequest请求时无视编码,无视证书,无视Cookie,网页抓取 1.第一招,根据URL地 ...

随机推荐

PHP中的$_SERVER['PATH_INFO']
PHP中的全局变量$_SERVER['PATH_INFO']是一个很有用的参数,众多的CMS系统在美化自己的URL的时候,都用到了这个参数. 对于下面这个网址: http://www.test.com ...
oracle insert/update
insert into table (,,) values (,,) where update table set (,)=(select , from ) where
svn 命令个
svn 命令行下常用的几个命令标签: svnpathdelete工作urlfile 2011-11-28 08:16 128627人阅读评论(1) 收藏举报分类: 版本控制(8) 版权声明 ...
java监听器演示样例
监听器的原理是观察者模式.就像明星(事件源)聚拢了一群粉丝(观察者).当明星有啥举动的时候会通过粉丝们报道出去. 订阅信息.计算器button都是该原理的应用. 以下写了一个监听器的小样例: pack ...
java基础&&高薪面试
董鹏老师 ,多年经验总结出 [高薪就业必备]之java基础面试题[更新中]: 第01篇学习Java基础的目的? 第02天 java语言中有没有gotoke ...
C递归算法与栈的分析,非全然二叉树遍历分析---ShinePans
对于递归,这里面的分析最好当然是用图形的方式来分析了.这里来总结一下 1.首先对于栈的理解: 先进后出,后进先出先进后出 2.在进行非全然二叉树的存储之后,我们要做的是对其 ...
Markdown 语法的超快速上手
本文支持WTFPL协议,因此你想往哪转就往哪转. Why markdown? Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式. Ma ...
Ubuntu 静态IP
linux 用了好多年了,每次设置静态ip都上网查,就是记不住.唉~ cat /etc/network/interfaces auto lo iface lo inet loopback #auto ...
网络爬虫（蜘蛛）Scrapy,Python安装！
Scrapy,Python安装.使用! 1.下载安装Python2.7.6.由于Scrapy还不支持3.x版本号. Latest Python 2 Release - Python 2.7.6,安装时 ...
jquery live hover
$("table tr").live({ mouseenter: function() { //todo }, mouseleave: function() { //todo } ...

使用jdk获取网页

使用jdk获取网页的更多相关文章

随机推荐

热门专题