使用Jsoup帮助解析具有html标签的数据和解析网页
下载Jsoup包后导入
/**
* Created by YGW on 2016/4/17.
* 显示公告的详细内容
*/
public class
PressFragment extends Fragment{
@Override
public View onCreateView (LayoutInflater inflater,
ViewGroup container, Bundle savedInstanceState) {
View view=inflater.inflate (R.layout.ygw_announcement_item_specific,
null);
String content=getArguments ().getString
("content");
String title=getArguments ().getString
("title");
String time=getArguments ().getString ("time");
String apartment=getArguments ().getString ("apartment");
TextView tv_PressTitle=(TextView)view.findViewById
(R.id.PressTitle_item);
TextView
tv_PressContent=(TextView)view.findViewById (R.id.PressContent_Item);
tv_PressTitle.setText (Gonggaohtml(title));
tv_PressContent.setText (Gonggaohtml(content));
return view;
}
//
使用Jsoup解析,这里解决的为题是,解析<p>标签,把数据转化成String类型的
private String
Gonggaohtml(String html) {
Document doc = Jsoup.parse
(html);
Elements ps = doc.getElementsByTag ("p");
String
content = "";
for(Element p : ps) {
content = content
+ p.text ();
}
return content;
}
}
解析网页
下载Jsoup包后导入
/**
* Created by YGW on 2016/4/17.
* 显示公告的详细内容
*/
public class
PressFragment extends Fragment{
@Override
public View onCreateView (LayoutInflater inflater,
ViewGroup container, Bundle savedInstanceState) {
View view=inflater.inflate (R.layout.ygw_announcement_item_specific,
null);
String content=getArguments ().getString
("content");
String title=getArguments ().getString
("title");
String time=getArguments ().getString ("time");
String apartment=getArguments ().getString ("apartment");
TextView tv_PressTitle=(TextView)view.findViewById
(R.id.PressTitle_item);
TextView
tv_PressContent=(TextView)view.findViewById (R.id.PressContent_Item);
tv_PressTitle.setText (Gonggaohtml(title));
tv_PressContent.setText (Gonggaohtml(content));
return view;
}
//
使用Jsoup解析,这里解决的为题是,解析<p>标签,把数据转化成String类型的
private String
Gonggaohtml(String html) {
Document doc = Jsoup.parse
(html);
Elements ps = doc.getElementsByTag ("p");
String
content = "";
for(Element p : ps) {
content = content
+ p.text ();
}
return content;
}
}
解析网页
public class MainActivity extends AppCompatActivity {
private String url = "http://解析网页的Url";
private Handler handler;
private List<String> list_title;
private List<String> list_content;
private ListView lv_press;
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate (savedInstanceState);
setContentView (R.layout.activity_main);
lv_press=(ListView)findViewById (R.id.lv_press);
new Thread(new Runnable() {
@Override
public void run() {
parseHtml();
}
}).start ();
list_title = new ArrayList<String> ();
list_content= new ArrayList<String> ();
handler = new Handler (){
@Override
public void handleMessage (Message msg) {
super.handleMessage (msg);
if (msg.what == 0x123){
String title_value=msg.getData ().getString ("title_key");
String href_value=msg.getData ().getString ("href_key");
list_title.add (title_value);
list_content.add (href_value);
Log.i ("info", title_value + ":" + href_value);
// Log.i ("info", list_title.toString () + ":" + href_value);
lv_press.setAdapter (new PressListView (list_title,list_content, MainActivity.this));
}
}
};
lv_press.setOnItemClickListener (new AdapterView.OnItemClickListener () {
@Override
public void onItemClick (AdapterView<?> parent, View view, int position, long id) {
String path=list_content.get (position);
Intent intent = new Intent(Intent.ACTION_VIEW);
intent.setData(Uri.parse (path));
startActivity(intent);
}
});
}
protected void parseHtml() {
try {
Document doc = Jsoup.connect(url).get();
Elements elements = doc.select("div.unit");//解析这个大布局里的div布局名unit
for (Element ele : elements) {
String title = ele.getElementsByTag("h1").first().text();//解析所有h1标签
String href = ele.getElementsByTag("a").first().attr("href");//所有href标签
Log.i ("info","-----------------"+href);
if (!title.isEmpty ()){
Message msg= new Message ();
msg.what=0x123;
Bundle bundle = new Bundle ();
bundle.putString ("title_key",title);
bundle.putString ("href_key", href);
msg.setData (bundle);
handler.sendMessage (msg);
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
使用Jsoup帮助解析具有html标签的数据和解析网页的更多相关文章
- android基础---->JSON数据的解析
上篇博客,我们谈到了XML两种常用的解析技术,详细可以参见我的博客(android基础---->XMl数据的解析).网络传输另外一种数据格式JSON就是我们今天要讲的,它是比XML体积更小的数据 ...
- 网站seo优化--jsoup 批量分析相关网站 标签,描述,关键词.
网站seo优化--jsoup 批量分析相关网站 标签,描述,关键词. 因为自己写了一个磁力搜索网站Btgoogle,准备进行优化一下,需要分析其他的网站的优化情况. Java的Jsoup类库和PHP的 ...
- <script>标签的加载解析执行
转自原文 <script>标签的加载解析执行 看了很多网上的文章,都是大同小异.总结一下.内部原理还没有搞清楚,有机会再学习. 一.<script>标签的加载解析执行顺序 ht ...
- 【python小随笔】python 解析xml数据的新手大坑>>抓取多重标签,遍历各标签的数据
xml文档: <GetMatchingProductResult ASIN="B071LF9R6G" status="Success">...< ...
- golang中的反射解析结构体标签tag
package main import ( "fmt" "reflect" ) type resume struct { // 反射解析结构体标签tag Nam ...
- iOS开发网络篇—XML数据的解析
iOS开发网络篇—XML数据的解析 iOS开发网络篇—XML介绍 一.XML简单介绍 XML:全称是Extensible Markup Language,译作“可扩展标记语言” 跟JSON一样,也是 ...
- Struts2第十一篇【简单UI标签、数据回显】
Struts2UI标签 Sturts2为了简化我们的开发,也为我们提供了UI标签-也就是显示页面的标签-.. 但是呢,Struts2是服务端的框架,因此使用页面的标签是需要在服务器端解析然后再被浏览器 ...
- Struts2【UI标签、数据回显、资源国际化】
Struts2UI标签 Sturts2为了简化我们的开发,也为我们提供了UI标签...也就是显示页面的标签..... 但是呢,Struts2是服务端的框架,因此使用页面的标签是需要在服务器端解析然后再 ...
- android基础---->XMl数据的解析
在网络上传输数据时最常用的格式有两种,XML和JSON,下面首先学一下如何解析XML格式的数据,JSON的解析可以参见我的博客(android基础---->JSON数据的解析).解析XML 格式 ...
随机推荐
- H5制作1--母亲节快乐
H5作品现在很流行额. 早上起的很早.就自己试着去了解了一下.感觉很easy. 用了百度的H5在线制作工具.感觉很easy.顺便给百度做下推广吧.h5.baidu.com 于是就有了自己的第一个dem ...
- #pragma once 与 #ifndef 解析(转载)
正在入门驱动编程,遇到一个小问题,如下详细解释. 原文链接:#pragma once 与 #ifndef 解析 http://www.cnblogs.com/hokyhu/archive/2009/0 ...
- python join和split和strip用法
python join 和 split方法的使用,join用来连接字符串,split恰好相反,拆分字符串的. strip()为去除开头结尾指定的字符,空着时是去除空白字符\t,\n,\r意思 1.jo ...
- HW5.34
import java.util.Scanner; public class Solution { public static void main(String[] args) { Scanner i ...
- 重新学习struts
这就是所谓的一边工作一边学习. 今天准备把给公司写个管理页面,按照之前的路数,写起来应该挺快,但是不太规范.也就沉下心来学习一下了. 第一个学习的是,之前,在学校,听师兄说过,对页面编码可用inter ...
- 最简单的计算MD5方法
原来写过一个计算MD5的程序,是用了一个叫MD5.pas的单元,使用起来还算简单,但还有更简单的办法,安装了indy就会有IdHashMessageDigest单元(delphi 7默认安装indy) ...
- SQL Server 2008数据库创建,备份,还原图解及注意点
一.新建数据库 步骤1:点击“新建数据库”. 步骤2:输入数据库名称,设置数据库文件保存位置(注意点:最好自己设置数据库文件保存位置,不要采用安装时默认的文件保存位置!),点击“确认”即可完成新库的创 ...
- mysql事物
一. 什么是事务 事务就是一段sql 语句的批处理,但是这个批处理是一个atom(原子) ,不可分割,要么都执行,要么回滚(rollback)都不执行. 二.为什么出现这种技术 为什么要使用事务这个技 ...
- Android设计模式系列-单例模式
单例模式,可以说是GOF的23种设计模式中最简单的一个. 这个模式相对于其他几个模式比较独立,它只负责控制自己的实例化数量单一(而不是考虑为用户产生什么样的实例),很有意思,是一个感觉上很干净的模式, ...
- hdu 5480 Conturbatio 线段树 单点更新,区间查询最小值
Conturbatio Time Limit: 1 Sec Memory Limit: 256 MB 题目连接 http://acm.hdu.edu.cn/showproblem.php?pid=54 ...