java抓取快递信息
package zeze; import java.io.IOException; import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; public class TestJsoup { public Document getDocument(String url) {
try {
return Jsoup.connect(url).get();
} catch (IOException e) {
e.printStackTrace();
}
return null;
} public static void main(String[] args) throws IOException {
TestJsoup t = new TestJsoup();
String url ="http://www.kiees.cn/yto.php?wen=880350384879600241&action=ajax";//获取地址
Connection conn = Jsoup.connect(url);
// 设置查询参数
conn.data("wen", "880350384879600241");
Document doc = null;
// 设置请求类型
doc = conn.timeout(100000).get();
//处理返回数据
Elements results = new Elements();
results = doc.select("[class = yto]");
int i=0;
for (Element result : results)
{
Elements links = result.getElementsByTag("td");
for (Element link : links)
{
//必要的筛选
String val = link.text();
if(i%2==0)
System.out.println("时间:" + val);
else
System.out.println("状态:" + val);
i++;
}
} /*Elements zeze0 = new Elements();
Elements zeze1 = new Elements();
Elements zeze2 = new Elements();
String name;
String price;
String sales;
int count=0;
String key = "520675407117";
for (int i = 0; i < 3; i++) {
Document doc = t.getDocument("https://item.taobao.com/item.htm?id=" + key + "");
String b = key.substring(0, 5); String c = key.substring(5, 12); int d = Integer.parseInt(c);
key = b + (d + 1);
// 获取目标HTML代码
zeze0 = doc.select("[class= tb-main-title]");
name = zeze0.attr("data-title");//商品名 zeze1 = doc.select("[class=tb-rmb-num]");
price = zeze1.text();//价格 zeze2 = doc.select("#J_SellCounter");
sales = zeze2.text();//销量 if (name != "") {
count++;
System.out.println("id:" + key);
System.out.println("商品:" + name);
System.out.println("价格:" + price);
System.out.println("销量:" + sales);
}
}
System.out.println("本次采集总数:"+count);
System.out.println("end");*/ }
}
package zeze; import java.io.IOException; import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; public class TestJsoup { public Document getDocument(String url) {
try {
return Jsoup.connect(url).get();
} catch (IOException e) {
e.printStackTrace();
}
return null;
} public static void main(String[] args) throws IOException {
TestJsoup t = new TestJsoup();
String url = "http://www.zto.cn/GuestService/Bill";// 获取地址
Connection conn = Jsoup.connect(url); String key = "368853112593"; // 设置查询参数
for (int j = 0; j < 100; j++) {
String b = key.substring(0, 8);
String c = key.substring(8,12);
int d = Integer.parseInt(c);
key = b + (d + 1);
System.out.println("key:" + key);
conn.data("txtBill", key);
Document doc = null;
// 设置请求类型
doc = conn.post();
// 处理返回数据
Elements results = new Elements();
results = doc.select("[class = state]");
int i = 0;
for (Element result : results) {
Elements links = result.select("[class = routeTips]");
for (Element link : links) {
// 必要的筛选
String val = link.text();
if (i % 2 == 0)
System.out.println("时间:" + val);
else
System.out.println("状态:" + val);
i++;
}
}
} /*
* Elements zeze0 = new Elements(); Elements zeze1 = new Elements();
* Elements zeze2 = new Elements(); String name; String price; String
* sales; int count=0; String key = "520675407117"; for (int i = 0; i <
* 3; i++) { Document doc =
* t.getDocument("https://item.taobao.com/item.htm?id=" + key + "");
* String b = key.substring(0, 5);
*
* String c = key.substring(5, 12);
*
* int d = Integer.parseInt(c); key = b + (d + 1); // 获取目标HTML代码 zeze0 =
* doc.select("[class= tb-main-title]"); name =
* zeze0.attr("data-title");//商品名
*
* zeze1 = doc.select("[class=tb-rmb-num]"); price = zeze1.text();//价格
*
* zeze2 = doc.select("#J_SellCounter"); sales = zeze2.text();//销量
*
*
* if (name != "") { count++; System.out.println("id:" + key);
* System.out.println("商品:" + name); System.out.println("价格:" + price);
* System.out.println("销量:" + sales); } }
* System.out.println("本次采集总数:"+count); System.out.println("end");
*/ }
}
package zeze; import java.io.IOException; import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements; public class TestJsoup { public Document getDocument(String url) {
try {
return Jsoup.connect(url).get();
} catch (IOException e) {
e.printStackTrace();
}
return null;
} public static void main(String[] args) throws IOException {
TestJsoup t = new TestJsoup();
String url = "http://www.kiees.cn/yto.php?wen=880350384879600241&action=ajax";// 获取地址
Connection conn = Jsoup.connect(url); String key = "880350384879600241"; // 设置查询参数
for (int j = 0; j < 100; j++) {
String b = key.substring(0, 11);
String c = key.substring(11,17);
int d = Integer.parseInt(c);
key = b + (d + 1);
System.out.println("key:" + key);
conn.data("wen", key);
Document doc = null;
// 设置请求类型
doc = conn.timeout(100000).get();
// 处理返回数据
Elements results = new Elements();
results = doc.select("[class = yto]");
int i = 0;
for (Element result : results) {
Elements links = result.getElementsByTag("td");
for (Element link : links) {
// 必要的筛选
String val = link.text();
if (i % 2 == 0)
System.out.println("时间:" + val);
else
System.out.println("状态:" + val);
i++;
}
}
} /*
* Elements zeze0 = new Elements(); Elements zeze1 = new Elements();
* Elements zeze2 = new Elements(); String name; String price; String
* sales; int count=0; String key = "520675407117"; for (int i = 0; i <
* 3; i++) { Document doc =
* t.getDocument("https://item.taobao.com/item.htm?id=" + key + "");
* String b = key.substring(0, 5);
*
* String c = key.substring(5, 12);
*
* int d = Integer.parseInt(c); key = b + (d + 1); // 获取目标HTML代码 zeze0 =
* doc.select("[class= tb-main-title]"); name =
* zeze0.attr("data-title");//商品名
*
* zeze1 = doc.select("[class=tb-rmb-num]"); price = zeze1.text();//价格
*
* zeze2 = doc.select("#J_SellCounter"); sales = zeze2.text();//销量
*
*
* if (name != "") { count++; System.out.println("id:" + key);
* System.out.println("商品:" + name); System.out.println("价格:" + price);
* System.out.println("销量:" + sales); } }
* System.out.println("本次采集总数:"+count); System.out.println("end");
*/ }
}
java抓取快递信息的更多相关文章
- PHP快速抓取快递信息
<?php header("Content-type:text/html;charset=utf-8"); /** * Express.class.php 快递查询类 * @ ...
- java抓取快递100信息接口
package zeze; import java.io.IOException; import org.json.JSONArray; import org.json.JSONException; ...
- HttpClient+Jsoup 抓取网页信息(网易贵金属为例)
废话不多说直接讲讲今天要做的事. 利用HttpClient和Jsoup技术抓取网页信息.HttpClient是支持HTTP协议的客户端编程工具包,并且它支持HTTP协议. jsoup 是一款基于 Ja ...
- 网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(3): 抓取amazon.com价格
通过上一篇随笔的处理,我们已经拿到了书的书名和ISBN码.(网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息 ...
- 网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息及ISBN码
这一篇首先从allitebooks.com里抓取书籍列表的书籍信息和每本书对应的ISBN码. 一.分析需求和网站结构 allitebooks.com这个网站的结构很简单,分页+书籍列表+书籍详情页. ...
- java 抓取网页图片
import java.io.File; import java.io.FileOutputStream; import java.io.InputStream; import java.io.Out ...
- .net抓取网页信息 - Jumony框架使用1
往往在实际开发中,经常会用到一些如抓取网站信息之类的的操作,往往大家采用的是用一些正则的方式获取,但是有时候正则是很死板的,我们常常试想能不能使用jquery的选择器,获取符合自己要求的元素,然后进行 ...
- SpringCloud系列九:SpringCloudConfig 基础配置(SpringCloudConfig 的基本概念、配置 SpringCloudConfig 服务端、抓取配置文件信息、客户端使用 SpringCloudConfig 进行配置、单仓库目录匹配、应用仓库自动选择、仓库匹配模式)
1.概念:SpringCloudConfig 基础配置 2.具体内容 通过名词就可以发现,SpringCloudConfig 核心作用一定就在于进行配置文件的管理上.也就是说为了更好的进行所有微服务的 ...
- Web Scraper 高级用法——抓取属性信息 | 简易数据分析 16
这是简易数据分析系列的第 16 篇文章. 这期课程我们讲一个用的较少的 Web Scraper 功能--抓取属性信息. 网页在展示信息的时候,除了我们看到的内容,其实还有很多隐藏的信息.我们拿豆瓣电影 ...
随机推荐
- Java排序算法——冒泡排序
import java.util.Arrays; //================================================= // File Name : Bubble_S ...
- JavaScript学习笔记——对象知识点
javascript对象的遍历.内存分布和封装特性 一.javascript对象遍历 1.javascript属性访问 对象.属性 对象[属性] //字符串格式 //javascript属性的访问方法 ...
- JavaScript 的性能优化:加载和执行
随着 Web2.0 技术的不断推广,越来越多的应用使用 javascript 技术在客户端进行处理,从而使 JavaScript 在浏览器中的性能成为开发者所面临的最重要的可用性问题.而这个问题又因 ...
- Object.prototype.toString.call() 区分对象类型
判断一个对象的类型: /** * 判断对象是否为数组 * @param {Object} source 待判断的对象 * @return {Boolean} true|false */ Object. ...
- 二叉排序树(Binary Sort Tree)
参考文章:http://blog.csdn.net/ns_code/article/details/19823463 不过博主的使用第一种方法操作后的树已经不是二叉排序树了,值得深思!! #inclu ...
- string.replace正则表达式说明
str.replace(reg,function($0,$1,$2...,index,str){ }); $0: 匹配模式的字符串$1...: 匹配模式子表达式的字符串,0个或多个,个数取决于子表达式 ...
- C# 协变out 、逆变 in
需求:泛型使用多态性 备注:协变逆变只能修饰 接口和委托 简单理解: 1.使用 in 修饰后为逆变,只能用作形参使用 ,参考 public delegate void Action<in T&g ...
- 【转】linux ar 命令的使用说明那个和例子
from: http://blog.csdn.net/xljiulong/article/details/7082960 linux ar 命令的使用说明那个和例子 标签: linuxmakefile ...
- jq 构造函数,然后再表单提交过程中对数据进行修改
先贴代码 <script type="text/javascript"> function appendText(){ var content = $("#t ...
- 结果集(result set)解释与用法
解释: 引用自wiki: An SQL result set is a set of rows from a database, as well as metadata about the query ...