java爬取百度首页源代码

爬虫感觉挺有意思的，写一个最简单的抓取百度首页html代码的程序。虽然简单了一点，后期会加深的。

 package test;

     import java.io.BufferedReader;

     import java.io.InputStreamReader;

     import java.net.URL;

     import java.net.URLConnection;

     public class Main

     {

         public static void main(String[] args)

         {

             // 定义即将访问的链接

             String url = "https://www.baidu.com/";

             // 定义一个字符串用来存储网页内容

             String result = "";

             // 定义一个缓冲字符输入流

             BufferedReader in = null;

             try

             {

                 // 将string转成url对象

                 URL realUrl = new URL(url);

                 // 初始化一个链接到那个url的连接

                 URLConnection connection = realUrl.openConnection();

                 // 开始实际的连接

                 connection.connect();

                 // 初始化 BufferedReader输入流来读取URL的响应

                 in = new BufferedReader(new InputStreamReader(connection.getInputStream()));

                 // 用来临时存储抓取到的每一行的数据

                 String line;

                 while ((line = in.readLine()) != null)

                 {

                     // 遍历抓取到的每一行并将其存储到result里面

                     result += line + "\n";

                 }

             } catch (Exception e)

             {

                 System.out.println("发送GET请求出现异常！" + e);

                 e.printStackTrace();

             } // 使用finally来关闭输入流

             finally

             {

                 try

                 {

                     if (in != null)

                     {

                         in.close();

                     }

                 } catch (Exception e2)

                 {

                     e2.printStackTrace();

                 }

             }

             System.out.println(result);

         }

     }

java爬取百度首页源代码的更多相关文章

Java爬取百度图片Google图片Bing图片
先看看抓取的结果. 8个Java类: Startup.java - main函数 ImageCrawler.java - Crawler基类 BaiduImageCrawler.java - 百度图片 ...
JAVA爬取百度贴吧图片
package com.wang.xiaowei.utils; import com.sun.image.codec.jpeg.JPEGCodec; import com.sun.image.code ...
Java网络爬虫Hello world实现——Httpclient爬取百度首页
1.创建Maven项目 2.Httpclient Maven地址 <dependency> <groupId>org.apache.httpcomponents</gro ...
【python爬虫】之爬取百度首页
刚开始学习爬虫,照着教程手打了一遍,还是蛮有成就感的.使用版本:python2.7 注意:python2的默认编码是ASCII编码而python3默认编码是utf-8 import urllib2 u ...
java 如何爬取百度百科词条内容(java如何使用webmagic爬取百度词条)
这是老师所布置的作业说一下我这里的爬去并非能把百度词条上的内容一字不漏的取下来(而是它分享链接的一个主要内容概括...)(他的主要内容我爬不到也不想去研究大家有好办法可以call me) 例如互 ...
WebCollector爬取百度搜索引擎样例
使用WebCollector来爬取百度搜索引擎依照关键字搜索的结果页面,解析规则可能会随百度搜索的改版而失效. 代码例如以下: package com.wjd.baidukey.crawler; im ...
java爬取并下载酷狗TOP500歌曲
是这样的,之前买车送的垃圾记录仪不能用了,这两天狠心买了好点的记录仪,带导航.音乐.蓝牙.4G等功能,寻思,既然有这些功能就利用起来,用4G听歌有点奢侈,就准备去酷狗下点歌听,居然都是需要办会员才能下 ...
使用Jsoup 爬取网易首页所有的图片
package com.enation.newtest; import java.io.File; import java.io.FileNotFoundException; import java. ...
利用python的爬虫技术爬取百度贴吧的帖子
在爬取糗事百科的段子后,我又在知乎上找了一个爬取百度贴吧帖子的实例,为了巩固提升已掌握的爬虫知识,于是我打算自己也做一个. 实现目标:1,爬取楼主所发的帖子 2,显示所爬去的楼层以及帖子题目 3,将爬 ...

随机推荐

C# WPF 开发随想
最近项目遇到切换窗口的时候偶尔出现闪屏的问题,前前后后花了两天的时间还是没有找到问题所在,一部分一部分的注释代码,看逻辑,开布局,还是一无所获. 最后还是他人的提醒下,直接不切换窗口,在同一个窗口中布 ...
编写高质量JS代码上
想写出高效的javascript类库却无从下手: 尝试阅读别人的类库,却理解得似懂给懂: 打算好好钻研js高级函数,但权威书上的内容太零散, 即使记住“用法”,但到要“用”的时候却没有想“法”. 也许 ...
谈谈iOS开发如何写个人中心这类页面--静态tableView页面的编写
本文来自网易云社区 . 一.本文讲的是什么问题? 在开发 iOS 应用时,基本都会遇到个人中心.设置.详情信息等页面,这里截取了某应用的详情编辑页面和个人中心页面,如下: 我们以页面结构的角度考虑这 ...
gdb调试参数
参考这里 1)gdb 打印字符串的全部内容 set print element 0 2)用x命令查看内存(examine的缩写) (gdb) x/1ub 0x7ffff7fbf7a00x7ffff7 ...
HTML-▲▲video 视频标签全属性详解▲▲
HTML 5 video 视频标签全属性详解现在如果要在页面中使用video标签,需要考虑三种情况,支持Ogg Theora或者VP8(如果这玩意儿没出事的话)的(Opera.Mozilla.C ...
TCP/IP——何时用UDP代替TCP
UDP和TCP UDP和TCP都有其自身的特点,不同的应用场景和要求需要使用不同的协议来传输,那么何时我们可以用UDP代替TCP呢. UDP 的优点 UDP支持广播和多播,事实上如果应用程序使用广播或 ...
python之类与对象（5）
6. 类的多继承与超继承 6.1 多继承 python的类还有一个特点,就是可以继承多个类.但是我们作为测试人员,在实际中很少用到这个多继承,这里不就详细(一直都不详细,hhhh)写了.上代码: #! ...
做point data的切面的时候的注意事项
正确的顺序应该是: 先导入cell data,再转换为point data,再做切面.结果如下: 如果这里导入cell data以后先做了切面再转换为point data,结果就是这样的: 很明显中间 ...
mfix中更改time dependent VTK filename的最大时间步数的容量
默认是0000四位,有可能保存文件多了以后不够用,可以在源码中修改,修改以后效果: 源码位置: 把 I4. 改成 I5.
[转]矩阵树$Matrix-Tree$定理与行列式
[https://www.cnblogs.com/zj75211/p/8039443.html][矩阵树Matrix-Tree定理与行列式]

java爬取百度首页源代码

java爬取百度首页源代码的更多相关文章

随机推荐

热门专题