【Android Demo】获取指定网页的页面源代码

1.直接上效果图

2.代码

主要就是工具类HtmlService.java：

import java.io.ByteArrayOutputStream;

import java.io.InputStream;

import java.net.HttpURLConnection;

import java.net.URL;

/**

 * 获取HTML数据

 *

 * @author David

 *

 */

public class HtmlService {

    public static String getHtml(String path) throws Exception {

        // 通过网络地址创建URL对象

        URL url = new URL(path);

        // 根据URL

        // 打开连接，URL.openConnection函数会根据URL的类型，返回不同的URLConnection子类的对象，这里URL是一个http，因此实际返回的是HttpURLConnection

        HttpURLConnection conn = (HttpURLConnection) url.openConnection();

        // 设定URL的请求类别，有POST、GET 两类

        conn.setRequestMethod("GET");

        //设置从主机读取数据超时（单位：毫秒）

        conn.setConnectTimeout(5000);

        //设置连接主机超时（单位：毫秒）

        conn.setReadTimeout(5000);

        // 通过打开的连接读取的输入流,获取html数据

        InputStream inStream = conn.getInputStream();

        // 得到html的二进制数据

        byte[] data = readInputStream(inStream);

        // 是用指定的字符集解码指定的字节数组构造一个新的字符串

        String html = new String(data, "utf-8");

        return html;

    }

    /**

     * 读取输入流，得到html的二进制数据

     *

     * @param inStream

     * @return

     * @throws Exception

     */

    public static byte[] readInputStream(InputStream inStream) throws Exception {

        ByteArrayOutputStream outStream = new ByteArrayOutputStream();

        byte[] buffer = new byte[1024];

        int len = 0;

        while ((len = inStream.read(buffer)) != -1) {

            outStream.write(buffer, 0, len);

        }

        inStream.close();

        return outStream.toByteArray();

    }

}

MainActivity.java 修改如下：

public class MainActivity extends Activity {

    private String path = "http://www.cnblogs.com/yc-755909659/";

    @Override

    protected void onCreate(Bundle savedInstanceState) {

        super.onCreate(savedInstanceState);

        setContentView(R.layout.activity_main);

        TextView textView = (TextView)this.findViewById(R.id.textView);

        try {

            String htmlContent = HtmlService.getHtml(path);

            textView.setText(htmlContent);

        } catch (Exception e) {

            textView.setText("程序出现异常："+e.toString());

        }

    }

}

activity_main.xml 很简单，还是放上来吧

<ScrollView xmlns:android="http://schemas.android.com/apk/res/android"

    android:layout_width="fill_parent"

    android:layout_height="fill_parent" >

    <TextView

        android:id="@+id/textView"

        android:layout_width="wrap_content"

        android:layout_height="wrap_content" />

</ScrollView>

最后，记得添加网络访问权限哦

<uses-permission android:name="android.permission.INTERNET"/>

来源：Android获取HTML数据

【Android Demo】获取指定网页的页面源代码的更多相关文章

Android遍历获取指定目录的文件
我们经常遇到一个问题,需要获取指定目录的某些扩展名的文件,并将其存在Vector中,怎么来实现呢? // 获取当前目录下所有的mp4文件 public static Vector<String& ...
C#获取指定网页源码的几种方法
// WebClient private string GetWebClient(string url) { string strHTML = ""; WebClient myWe ...
C#快速获取指定网页源码的几种方式，并通过字符串截取函数或正则取指定内容(IP)
//只获取网页源码开始到标题位目的进行测试 //第一种方式经过测试,稍微快点 string url = "http://www.ip.cn"; HttpWebRequest req ...
Android遍历获取指定目录的文件（转）
// 获取当前目录下所有的mp4文件 public static Vector<String> GetVideoFileName(String fileAbsolutePath) { Ve ...
android 打开浏览器指定网页
<?xml version="1.0" encoding="utf-8"?>  ...
【python】获取指定网页上的所有超级链接
# -*- coding: utf-8 -*- import urllib2 import re #connect to a URL website = urllib2.urlopen("h ...
Python 网络爬虫与信息获取（二）—— 页面内容提取
1. 获取超链接 python获取指定网页上所有超链接的方法 links = re.findall(b'"((http|ftp)s?://.*?)"', html) links = ...
Android 获取浏览器当前分享页面的截屏
Android 获取浏览器当前分享页面的截屏版权声明:本文为博主原创文章,未经博主允许不得转载. 微博:厉圣杰源码:AndroidDemo/BrowserScreenShotActivity 文中 ...
Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接，并下载这些URL链接的源代码
通过正则表达式来获取一个网页中的所有的 URL链接,并下载这些 URL链接的源代码使用的系统:Windows 10 64位 Python 语言版本:Python 2.7.10 V 使用的编程 ...

随机推荐

C# Web Forms - Using jQuery FullCalendar
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <title></title> ...
配置了<mvc:resources> 导致以前的controller 无法访问。
解决方案: <mvc:annotation-driven/>
linux压缩和解压命令总结
一.tar.gz tar -xzvf 二.tar.bz2 tar.bz2 解压命令 bzip2 -d gcc-4.1.0.tar.bz2---上面解压完之后执行下面的命令.执行成功后,会解压生成一个 ...
rabbitmq队列中消息过期配置
最近公司某个行情推送的rabbitmq服务器由于客户端异常导致rabbitmq队列中消息快速堆积,还曾导致过内存积压导致rabbitmq客户端被block的情况.考虑到行情信息从业务上来说可以丢失部分 ...
我所了解的WEB开发（1）
开始接触网站开发的时候,概念里就对静态网站和动态网站有了简单的区分,静态网站仅仅是纯粹的HTML网页,动态网站是需要采用asp 连接数据库(比如access).那个时候听说高手都是使用 Notepad ...
js的基本数据类型有哪些？
js的基本数据类型有哪些? ECMAScript中有5中简单数据类型(也称为基本数据类型): Undefined.Null.Boolean.Number和String.还有1中复杂的数据类型----O ...
Math对象常用方法汇总
前几天翻阅<JavaScript权威指南>,看到了Math对象,于是汇总了一下. Math对象不同于其他的对象,它可以说是一个公共数学类,里面有很多数学方法,用于各种数学运算,但是Math ...
SQL如何取得一个面的中心点
) .sdo_point.x x, sdo_geom.sdo_centroid(t.shape, ) .sdo_point.y y from gd_zy_region t SQL如何取得一个面的中心点 ...
桥牌笔记索引，牌例全部摘自Bridge Master 2000
Level 3 A A34-到处都是希望 B B14 防将牌失控 B26 探索式打法 C C1 绝不能让东家上手 C5 4-1分布该怎么办? C10 保持将牌控制 C27 多一个成功机会 D D1 注 ...
解决SwipeRefreshLayout左右滑动事件冲突的问题
在使用SwipeRefreshLayout时我们注意到在SwipeRefreshLayout中左右滑动时可能也会触发下拉刷新的事件,这点让我们很不爽.追其原因是SwipeRefreshLayout对于 ...

【Android Demo】获取指定网页的页面源代码

【Android Demo】获取指定网页的页面源代码的更多相关文章

随机推荐

热门专题