JAVA 获取网页源代码保存到本地文件

package httpget;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.net.HttpURLConnection;

import java.net.URL;

public class demo {

    private String u;

    private String encoding;

    public static void main(String[] args) throws Exception {

    	String url = "http://www.baidu.com/";

        demo client = new demo(url, "gb2312");

        client.run();

    }

    public demo(String u, String encoding) {

        this.u = u;

        this.encoding = encoding;

    }

    public void run() throws Exception {

    	File fp = new File("E:\\zc\\test.txt");

        URL url = new URL(u);

        // 根据链接（字符串格式），生成一个URL对象

        HttpURLConnection urlConnection = (HttpURLConnection) url

                .openConnection();// 打开URL

        BufferedReader reader = new BufferedReader(new InputStreamReader(

                urlConnection.getInputStream(), encoding));

        // 得到输入流，即获得了网页的内容

        String line;

        while ((line = reader.readLine())!= null)

        {

        	addfile(line,fp);

        }

    }

    public void addfile(String line,File fp) throws IOException //追加文件

    {

    	try {

    		String str = "\r\n";

			FileOutputStream af = new FileOutputStream(fp,true);

			af.write(line.getBytes());

			af.write(str.getBytes());

		} catch (FileNotFoundException e)

    	{

			// TODO Auto-generated catch block

			System.out.println("写入失败!");

			e.printStackTrace();

		}

    }

}

　如果不明白上面有些方法的意思可以自己去查API文档

JAVA 获取网页源代码保存到本地文件的更多相关文章

java获取网页源代码并写入本地文件中
import java.io.*; import java.net.*; public class URLDemo { public static void main(String args[]){ ...
JAVA获取网络图片并保存到本地（随机图片接口）
import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileOutputStream; import j ...
Python3.4 获取百度网页源码并保存在本地文件中
最近学习python 版本 3.4 抓取网页源码并且保存在本地文件中 import urllib.request url='http://www.baidu.com' #上面的url一定要写明确,如果 ...
Java 网络爬虫获取网页源代码原理及实现
Java 网络爬虫获取网页源代码原理及实现 1.网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成.传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL ...
Java读取oracle数据库中blob字段数据文件保存到本地文件(转载)
转自:https://www.cnblogs.com/forever2698/p/4747349.html package com.bo.test; import java.io.FileOutput ...
php 获取远程图片保存到本地
php 获取远程图片保存到本地使用两个函数 1.获取远程文件 2.把图片保存到本地 /** * 获取远程图片并把它保存到本地 * $url 是远程图片的完整URL地址,不能为空. */ functi ...
c#利用WebClient和WebRequest获取网页源代码的比较
前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...
c#利用WebClient和WebRequest获取网页源代码
C#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取网页源代码 WebClient类 WebClient ...
PHP获取网络图片并保存在本地目录
PHP获取网络图片并保存在本地目录思路: 代码如下: function file_exists_S3($url) { $state = @file_get_contents($url,0,null,0 ...

随机推荐

第2章 Innodb 存储引擎
一.InnoDB 体系架构 1.1后台线程 master thread:刷新内存中的数据到磁盘 io thread:处理 IO 请求,AIO purge thread:清理undo 页的回收 page ...
2.监控利器nagios手把手企业级实战第一部
1. 什么是Nagios? Nagios是一款开源的网络及服务的监控工具,功能强大,灵活性强,需要注意的是,其服务端只能在linux上面安装. Nagios可以进行分布 ...
yuyuecms 1.2文件删除漏洞
www.yuyue-cms.com yuyuecms版本1.2 管理员/索引控制器删除方法中的漏洞请参阅catfishcmsCatfish isPost静态方法如果调用后验证静态方法如果为tru ...
android studio 3.2 bundle.gradle 与2.2区别
参考:https://blog.csdn.net/MakerCloud/article/details/82898305
C# 创建、部署和调用WebService的简单示例 (转)
C# 创建.部署和调用WebService的简单示例(转) 转自 https://www.cnblogs.com/Brambling/p/7266482.html webservice 可以用于分 ...
redis设置cpu核数与内存
每个redis实例,给系统要预留至少1/4核,可使用1核心cpu.内存要预留1/2. 比如:8核120G的服务器,可部署8-8/4=6个redis实例,每个实例120/2/6=10G内存.
Java实现生产与消费(完美注释版)
/** * 2019年8月8日17:42:23 * 目的:Java多线程实现生产与消费 * @author 张涛 * * 多态: * 一个父类的引用既可以指向父类对象 * 也可以指向子类对象 * 它会 ...
Java之异常的处理(try-catch)
import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java. ...
raw_input|active:|continue|break|
a = "please" b = "say something:" c =a+b m = 0 a = True while a: m = int(raw_inp ...
如何在linux中运行sql文件
1.在linux中进入sql命令行 mysql -u root -p 输入密码 2.假设home下面有a.sql文件先得use databasename,要不会报错 “No Database S ...

JAVA 获取网页源代码保存到本地文件

JAVA 获取网页源代码保存到本地文件的更多相关文章

随机推荐

热门专题