抓取网站数据解析的工作,其中,使用到GET和POST方法获取html数据。

使用GET方式:

  1. /**
  2. * 使用get方式获取html数据
  3. *
  4. * @param strURL(需要访问的网站)
  5. * @return
  6. * @throws Exception
  7. */
  8. public String getHTML(String strURL) throws Exception {
  9. //创建浏览器
  10. HttpClient httpClient = HttpClients.createDefault();
  11. String html = null;
  12. //预防网址链接中包含特殊字符,将url转为uri
  13. URL url = new URL(strURL);
  14. URI uri = new URI(url.getProtocol(), url.getHost(), url.getPath(),
  15. url.getQuery(), null);
  16. //使用get方式
  17. HttpGet request = new HttpGet(uri);
  18. HttpResponse response;
  19. try {
  20. //连接网址获取返回的数据
  21. response = httpClient.execute(request);
  22. //将返回的数据按照gbk的方式编码
  23. html = EntityUtils.toString(response.getEntity(), "GBK");
  24. } catch (IOException e) {
  25. e.printStackTrace();
  26. }
  27. //断开连接
  28. request.abort();
  29. //返回网址所发挥的html数据
  30. return html;
  31. }

使用该方法便可以获取得到网站所发挥的html数据。

使用POST方式:

  1. /**
  2. * 使用post方式获取html数据
  3. *
  4. * @param libraryUrl(需要访问的网站)
  5. * @param params(需要传入的参数)
  6. * @return
  7. * @throws Exception
  8. */
  9. public String postHTML(String strURL, List<NameValuePair> params)
  10. throws Exception {
  11. //创建浏览器
  12. HttpClient httpClient = HttpClients.createDefault();
  13. String html = null;
  14. //预防网址链接中包含特殊字符,将url转为uri
  15. URL url = new URL(strURL);
  16. URI uri = new URI(url.getProtocol(), url.getHost(), url.getPath(),
  17. url.getQuery(), null);
  18. //使用POST方式
  19. HttpPost request = new HttpPost(uri);
  20. //将参数封装进UrlEncodedFormEntity中
  21. UrlEncodedFormEntity entity = new UrlEncodedFormEntity(params);
  22. request.setEntity(entity);
  23. HttpResponse response;
  24. try {
  25. //连接网址获取返回的数据
  26. response = httpClient.execute(request);
  27. //将返回的数据按照gbk的方式编码
  28. html = EntityUtils.toString(response.getEntity(), "GBK");
  29. } catch (IOException e) {
  30. e.printStackTrace();
  31. }
  32. //断开连接
  33. request.abort();
  34. //返回网址所发挥的html数据
  35. return html;
  36. }

其中,参数params的封装可以参照以下方式:

  1. List<NameValuePair> params = new ArrayList<NameValuePair>();
  2. //以键值对的方式存储
  3. params.add(new BasicNameValuePair("format", "hitcount"));

使用GET与POST方式获取html数据的更多相关文章

  1. Http方式获取网络数据

    通过以下代码可以根据网址获取网页的html数据,安卓中获取网络数据的时候会用到,而且会用Java中的sax方式解析获取到数据.(sax解析主要是解析xml)具体代码如下: package com.wy ...

  2. 基于uFUN开发板的心率计(一)DMA方式获取传感器数据

    前言 从3月8号收到板子,到今天算起来,uFUN到手也有两周的时间了,最近利用下班后的时间,做了个心率计,从单片机程序到上位机开发,到现在为止完成的差不多了,实现很简单,uFUN开发板外加一个Puls ...

  3. IOS开发之Post 方式获取服务器数据

    //1.创建post方式的 参数字符串url +(NSString *)createPostURL:(NSMutableDictionary *)params { NSString *postStri ...

  4. [NSURLSession/Delegate]用Post方式获取网络数据并把数据显示到表格

    #pragma mark 实现NSURLSessionDataDelegate代理 @interface ViewController ()<UITableViewDataSource,UITa ...

  5. [NSURLConnection]分别用Post和Get方式获取网络数据并把数据显示到表格

    @interface ViewController ()<UITableViewDataSource,UITableViewDelegate> { UIButton* getButton; ...

  6. 用 get 同步/异步 方式获取网络数据并输出

    //同步请求 //创建NSString用来存储请求的网址 NSString* str=@"http://v.juhe.cn/weather/index?format=2&cityna ...

  7. jQuery AJAX获取JSON数据解析多种方式示例

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

  8. J2EE Web开发入门—通过action是以传统方式返回JSON数据

    关键字:maven.m2eclipse.JSON.Struts2.Log4j2.tomcat.jdk7.Config Browser Plugin Created by Bob 20131031 l ...

  9. android—获取网络数据

    取网络数据主要靠发交易(或者说请求,接口等),而这些交易由java中的网络通信,HttpURLConnection和HttpClient实现,以下是具体例子.   大家都知道,网络通信,发送请求有两种 ...

随机推荐

  1. cpp 面向对象初步探索

    需求 尝试定义一个complex(复数类) 简略实现 headers/complex.h #ifndef __COMPLEX__ #define __COMPLEX__ class complex { ...

  2. CloudSim学习

    CloudSim CloudSim是墨尔本大学云计算和分布式系统实验室推出的云计算模拟软件.它可以使研究者规避实际部署的诸多不便(比如说资金缺乏等因素),在单机上即可实现对大规模云集群的模拟和相应算法 ...

  3. 大v用户数据统计分析

    1,统计数据的基本情况,包括微博总数,用户总数,最活跃和最不活跃的用户id #!/bin/sh source_dir=/home/minelab/data/DATA source_file_name= ...

  4. android和网络连接相关的类URL,URLConnection,HttpURLConnection,HttpClient

    这几个类都是用于和服务器端的连接,有些功能都能够实现,关系是: 一.URL URL标识着网络上的一个资源:该类包含一些URL自身的方法,如获取URL对应的主机名称,端口号,协议,查询字符串外,还有些方 ...

  5. 图的深度优先搜索(DFS)和广度优先搜索(BFS)算法

    深度优先(DFS) 深度优先遍历,从初始访问结点出发,我们知道初始访问结点可能有多个邻接结点,深度优先遍历的策略就是首先访问第一个邻接结点,然后再以这个被访问的邻接结点作为初始结点,访问它的第一个邻接 ...

  6. Spring MVC 同一个方法同时返回view或json

    https://blog.csdn.net/zzg1229059735/article/details/50854778 @RequestMapping(value = "/htmlorjs ...

  7. MVC的一个简单实例

    基本思路: 一个Regist.jsp注册页面,用于收集用户信息,发送请求给控制器Servlet:控制器层Servlet封装模型层对象 jBean,并调用其方法regiser实现用户信息的保存:模型层J ...

  8. clr/c++自定线程安全集合

    代码如下: 难点重写索引器.重写基类方法.基类方法显示调用示例 generic <class T> public ref class SyncList : public List<T ...

  9. JavaScript apply

    https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Function/apply The ...

  10. lr中用C语言比较两个字符串变量

    以下脚本,定义两个一样的字符数组,对比后,打印出result的值: Action() { int result; char string1[] = "We can see the strin ...