现在,在不少应用场合中都希望做到数据抓取,特别是基于网页部分的抓取.其实网页抓取的过程实际上是通过编程的方法,去抓取不同网站网页后,再进行 分析筛选的过程.比如,有的比较购物网站,会同时去抓取不同购物网站的数据并将其保存在数据库中.一般,这些网页的抓取都需要对抓取回来的HTML进行解 析. .NET提供了很多类去访问并获得远程网页的数据,比如WebClient类和HttpWebRequest类.这些类对于利用HTTP去访问远端 的网页并且下载下来是很有用的,但在对于所下载下来的HTML的解析能力…
下载地址:http://htmlagilitypack.codeplex.com/ 1.添加HtmlAgilityPack.dll引用(引用类using HtmlAgilityPack;). 2.简单根据html中input的id获取value代码如下: // 模拟用户请求 WebClient webClient = new WebClient(); webClient.Encoding = System.Text.Encoding.UTF8; string htmlContext = webC…
package cn.bocai.pc.util; import java.io.BufferedWriter;import java.io.File;import java.io.FileOutputStream;import java.io.IOException;import java.io.OutputStreamWriter;import java.io.Writer;import java.util.Map; import freemarker.template.Configurat…
1.简介 之前做汉字转拼音是使用各种枚举的方式,将各种情况列举,这种方式出错的机率很大,经常对不上号.(如果你想了解更多:http://www.cnblogs.com/islands/articles/1231613.html 后来在度娘的过程中,发现了其实微软早有汉字转拼音的组件dll库,里面估计是封装了windows系统下输入法的汉字精华,所以转化过程中相对要准确的多.而我在做Xamarin.iOS的过程中,由于要对联系人进行首字母索引,因此使用到了它. 官网了解:http://www.mi…
简介 本文介绍net处理html页面元素的工具类(HtmlAgilityPack.dll)的使用,用途比较多的应该是例如采集类的功能,采集到的html字符串要怎样处理是一个头痛的问题,如果是截取就太麻烦了而且容易出错.所有就用到本文的第三方dll来处理了. 下载 下载地址:http://htmlagilitypack.codeplex.com/ 点击“download”按钮直接下载. 使用 1.添加HtmlAgilityPack.dll引用(引用类using HtmlAgilityPack;).…
集合中的元素工具类排序: Java提供了一个操作Set.List和Map等集合的工具类:Collections,该工具类提供了大量方法对集合进行排序.查询和修改等操作,还提供了将集合对象置为不可变.对集合对象实现同步控制等方法.这个类不需要创建对象,内部提供的都是静态方法. 简要列几个方法吧 (1)static void reverse(List<?> list): 反转列表中元素的顺序. (2)static void shuffle(List<?> list) : 对List集合…
Android-JSONUtil工具类 常用的Json工具类,包含Json转换成实体.实体转json字符串.list集合转换成json.数组转换成json public class JSONUtil { private static final String TAG = JSONUtil.class.getSimpleName(); private JSONUtil(){} private static Gson gson = new Gson(); /** * 传入一个头部,获取头部管控中的所…
import android.annotation.SuppressLint; import android.app.Activity; import android.content.Context; import android.content.Intent; import android.os.Build; import android.widget.Toast; public class ActivityAnimationUtil { private Context context; pr…
这几天做项目需要把多个item的id存储到一个字符串中,保存进数据库.保存倒是简单,只需要判断之前是否为空,如果空就直接添加,非空则拼接个"," 所以这个字符串的数据结构是这样的 String str = "a,b,c,d"; 保存简单了,那么删除指定元素呢?这就有点麻烦了,取网上查了好久,不是js的实现就是其他语言的,所以决心自己写个工具类,看了一上午,其中不乏有看不懂的demo(不是Java). 这是测试时候写的,已经可以用了,如果不想引入工具类的话,可以复制到…
TreeSet要求存放的对象所属的类必须实现Comparable接口,该接口提供了比较元素的compareTo()方法,当插入元素时会回调该方法比较元素的大小.TreeMap要求存放的键值对映射的键必须实现Comparable接口从而根据键对元素进行排序.Collections工具类的sort方法有两种重载的形式,第一种要求传入的待排序容器中存放的对象比较实现Comparable接口以实现元素的比较:第二种不强制性的要求容器中的元素必须可比较,但是要求传入第二个参数,参数是Comparator接…