java抓取快递信息
package zeze; import java.io.IOException; import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; public class TestJsoup { public Document getDocument(String url) {
try {
return Jsoup.connect(url).get();
} catch (IOException e) {
e.printStackTrace();
}
return null;
} public static void main(String[] args) throws IOException {
TestJsoup t = new TestJsoup();
String url ="http://www.kiees.cn/yto.php?wen=880350384879600241&action=ajax";//获取地址
Connection conn = Jsoup.connect(url);
// 设置查询参数
conn.data("wen", "880350384879600241");
Document doc = null;
// 设置请求类型
doc = conn.timeout(100000).get();
//处理返回数据
Elements results = new Elements();
results = doc.select("[class = yto]");
int i=0;
for (Element result : results)
{
Elements links = result.getElementsByTag("td");
for (Element link : links)
{
//必要的筛选
String val = link.text();
if(i%2==0)
System.out.println("时间:" + val);
else
System.out.println("状态:" + val);
i++;
}
} /*Elements zeze0 = new Elements();
Elements zeze1 = new Elements();
Elements zeze2 = new Elements();
String name;
String price;
String sales;
int count=0;
String key = "520675407117";
for (int i = 0; i < 3; i++) {
Document doc = t.getDocument("https://item.taobao.com/item.htm?id=" + key + "");
String b = key.substring(0, 5); String c = key.substring(5, 12); int d = Integer.parseInt(c);
key = b + (d + 1);
// 获取目标HTML代码
zeze0 = doc.select("[class= tb-main-title]");
name = zeze0.attr("data-title");//商品名 zeze1 = doc.select("[class=tb-rmb-num]");
price = zeze1.text();//价格 zeze2 = doc.select("#J_SellCounter");
sales = zeze2.text();//销量 if (name != "") {
count++;
System.out.println("id:" + key);
System.out.println("商品:" + name);
System.out.println("价格:" + price);
System.out.println("销量:" + sales);
}
}
System.out.println("本次采集总数:"+count);
System.out.println("end");*/ }
}
package zeze; import java.io.IOException; import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; public class TestJsoup { public Document getDocument(String url) {
try {
return Jsoup.connect(url).get();
} catch (IOException e) {
e.printStackTrace();
}
return null;
} public static void main(String[] args) throws IOException {
TestJsoup t = new TestJsoup();
String url = "http://www.zto.cn/GuestService/Bill";// 获取地址
Connection conn = Jsoup.connect(url); String key = "368853112593"; // 设置查询参数
for (int j = 0; j < 100; j++) {
String b = key.substring(0, 8);
String c = key.substring(8,12);
int d = Integer.parseInt(c);
key = b + (d + 1);
System.out.println("key:" + key);
conn.data("txtBill", key);
Document doc = null;
// 设置请求类型
doc = conn.post();
// 处理返回数据
Elements results = new Elements();
results = doc.select("[class = state]");
int i = 0;
for (Element result : results) {
Elements links = result.select("[class = routeTips]");
for (Element link : links) {
// 必要的筛选
String val = link.text();
if (i % 2 == 0)
System.out.println("时间:" + val);
else
System.out.println("状态:" + val);
i++;
}
}
} /*
* Elements zeze0 = new Elements(); Elements zeze1 = new Elements();
* Elements zeze2 = new Elements(); String name; String price; String
* sales; int count=0; String key = "520675407117"; for (int i = 0; i <
* 3; i++) { Document doc =
* t.getDocument("https://item.taobao.com/item.htm?id=" + key + "");
* String b = key.substring(0, 5);
*
* String c = key.substring(5, 12);
*
* int d = Integer.parseInt(c); key = b + (d + 1); // 获取目标HTML代码 zeze0 =
* doc.select("[class= tb-main-title]"); name =
* zeze0.attr("data-title");//商品名
*
* zeze1 = doc.select("[class=tb-rmb-num]"); price = zeze1.text();//价格
*
* zeze2 = doc.select("#J_SellCounter"); sales = zeze2.text();//销量
*
*
* if (name != "") { count++; System.out.println("id:" + key);
* System.out.println("商品:" + name); System.out.println("价格:" + price);
* System.out.println("销量:" + sales); } }
* System.out.println("本次采集总数:"+count); System.out.println("end");
*/ }
}
package zeze; import java.io.IOException; import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; public class TestJsoup { public Document getDocument(String url) {
try {
return Jsoup.connect(url).get();
} catch (IOException e) {
e.printStackTrace();
}
return null;
} public static void main(String[] args) throws IOException {
TestJsoup t = new TestJsoup();
String url = "http://www.kiees.cn/yto.php?wen=880350384879600241&action=ajax";// 获取地址
Connection conn = Jsoup.connect(url); String key = "880350384879600241"; // 设置查询参数
for (int j = 0; j < 100; j++) {
String b = key.substring(0, 11);
String c = key.substring(11,17);
int d = Integer.parseInt(c);
key = b + (d + 1);
System.out.println("key:" + key);
conn.data("wen", key);
Document doc = null;
// 设置请求类型
doc = conn.timeout(100000).get();
// 处理返回数据
Elements results = new Elements();
results = doc.select("[class = yto]");
int i = 0;
for (Element result : results) {
Elements links = result.getElementsByTag("td");
for (Element link : links) {
// 必要的筛选
String val = link.text();
if (i % 2 == 0)
System.out.println("时间:" + val);
else
System.out.println("状态:" + val);
i++;
}
}
} /*
* Elements zeze0 = new Elements(); Elements zeze1 = new Elements();
* Elements zeze2 = new Elements(); String name; String price; String
* sales; int count=0; String key = "520675407117"; for (int i = 0; i <
* 3; i++) { Document doc =
* t.getDocument("https://item.taobao.com/item.htm?id=" + key + "");
* String b = key.substring(0, 5);
*
* String c = key.substring(5, 12);
*
* int d = Integer.parseInt(c); key = b + (d + 1); // 获取目标HTML代码 zeze0 =
* doc.select("[class= tb-main-title]"); name =
* zeze0.attr("data-title");//商品名
*
* zeze1 = doc.select("[class=tb-rmb-num]"); price = zeze1.text();//价格
*
* zeze2 = doc.select("#J_SellCounter"); sales = zeze2.text();//销量
*
*
* if (name != "") { count++; System.out.println("id:" + key);
* System.out.println("商品:" + name); System.out.println("价格:" + price);
* System.out.println("销量:" + sales); } }
* System.out.println("本次采集总数:"+count); System.out.println("end");
*/ }
}
java抓取快递信息的更多相关文章
- PHP快速抓取快递信息
<?php header("Content-type:text/html;charset=utf-8"); /** * Express.class.php 快递查询类 * @ ...
- java抓取快递100信息接口
package zeze; import java.io.IOException; import org.json.JSONArray; import org.json.JSONException; ...
- HttpClient+Jsoup 抓取网页信息(网易贵金属为例)
废话不多说直接讲讲今天要做的事. 利用HttpClient和Jsoup技术抓取网页信息.HttpClient是支持HTTP协议的客户端编程工具包,并且它支持HTTP协议. jsoup 是一款基于 Ja ...
- 网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(3): 抓取amazon.com价格
通过上一篇随笔的处理,我们已经拿到了书的书名和ISBN码.(网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息 ...
- 网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息及ISBN码
这一篇首先从allitebooks.com里抓取书籍列表的书籍信息和每本书对应的ISBN码. 一.分析需求和网站结构 allitebooks.com这个网站的结构很简单,分页+书籍列表+书籍详情页. ...
- java 抓取网页图片
import java.io.File; import java.io.FileOutputStream; import java.io.InputStream; import java.io.Out ...
- .net抓取网页信息 - Jumony框架使用1
往往在实际开发中,经常会用到一些如抓取网站信息之类的的操作,往往大家采用的是用一些正则的方式获取,但是有时候正则是很死板的,我们常常试想能不能使用jquery的选择器,获取符合自己要求的元素,然后进行 ...
- SpringCloud系列九:SpringCloudConfig 基础配置(SpringCloudConfig 的基本概念、配置 SpringCloudConfig 服务端、抓取配置文件信息、客户端使用 SpringCloudConfig 进行配置、单仓库目录匹配、应用仓库自动选择、仓库匹配模式)
1.概念:SpringCloudConfig 基础配置 2.具体内容 通过名词就可以发现,SpringCloudConfig 核心作用一定就在于进行配置文件的管理上.也就是说为了更好的进行所有微服务的 ...
- Web Scraper 高级用法——抓取属性信息 | 简易数据分析 16
这是简易数据分析系列的第 16 篇文章. 这期课程我们讲一个用的较少的 Web Scraper 功能--抓取属性信息. 网页在展示信息的时候,除了我们看到的内容,其实还有很多隐藏的信息.我们拿豆瓣电影 ...
随机推荐
- css input checkbox和radio样式美化
参考:https://segmentfault.com/a/1190000004553258 http://www.haorooms.com/post/css_mh_ck_radio 思路都一样的,先 ...
- ecshop变量介绍
获得商品的信息,get_goods_info($goods_id) 获取前10销量排名,get_top10()
- Hmmer安装与使用
Hmmer的安装与使用 从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高的搜索速 ...
- chrome调试文章
http://blog.csdn.net/a6225301/article/details/20207191#t1 http://www.360doc.com/content/13/1220/11/8 ...
- FIFO学习心得
1,名字.FIFO=First in first out. 2,特点.顺序读入,顺序读出,先入先出. 3,用途.数据缓冲.使两个数据传输速率不一样的设备相匹配. 4,参数. ①,THE WIDTH和T ...
- Mysql分表和分区的区别、分库分表介绍与区别
分表和分区的区别: 一,什么是mysql分表,分区 什么是分表,从表面意思上看呢,就是把一张表分成N多个小表,具体请看:mysql分表的3种方法 什么是分区,分区呢就是把一张表的数据分成N多个区块,这 ...
- rehat 出现GDB debuginfo-install 问题处理
本人使用rhel 6 GDB 调试代码时,出现以下错误: Missing separate debuginfos, use: debuginfo-install glibc-2.12-1.166 ...
- mysql 时间格式与日期格式转换,去除datetime中的具体时间
DATE_FORMAT(`addtime`,'%Y-%m-%d') 时间格式转成字符串 time_format('1924-01-02', '%Y-%m-%d') 字符串转成时间格式 CONVERT ...
- jQuery.validator 详解二
前言:上一篇详细的介绍了jQuery.validator( 版本v1.13.0 )的验证规则,这一篇重点讲述它的源码结构,及如何来对元素进行验证,错误消息提示的内部实现 一.插件结构(组织方式) 在讲 ...
- Git基本常用命令
Git基本常用命令如下: mkdir: XX (创建一个空目录 XX指目录名) pwd: 显示当前目录的路径. git init 把当前的目录变成可以管理的git仓库,生成隐藏.git文件. git ...