C# 页面抓取类

抓取网站页面的内容，简单的类应用，代码如下：

 /// <summary>

        /// 获取页面内容

        /// </summary>

        /// <param name="url">Url链接</param>

        /// <returns></returns>

        public string WebHtmlCon(string url)

        {

            try

            {

                string htmlCon = "";

                WebRequest request = WebRequest.Create(url);

                WebResponse response = request.GetResponse();

                Stream stream = response.GetResponseStream();

                using (StreamReader sReader = new StreamReader(stream, Encoding.UTF8))

                {

                    htmlCon = sReader.ReadToEnd();

                }

                return htmlCon;

            }

            catch (Exception e)

            {

                return e.Message;

            }

        }

        /// <summary>

        /// 获取页面内容

        /// </summary>

        /// <param name="url">Url链接</param>

        /// <returns></returns>

        public string WebClientHtmlCon(string url)

        {

            try

            {

                WebClient webclient = new WebClient();

                webclient.Encoding = Encoding.UTF8;

                string HtmlCon = webclient.DownloadString(url);

                return HtmlCon;

            }

            catch (Exception E)

            {

                return E.Message;

            }

        }

根据抓取的内容进行实际应用。

例如api的应用，获取页面内容的json数据，并进行分析获取自己想要的数据：

json数据分析代码（引用的.Net自带的类库应用）：

         /// <summary>

        /// JSON数据解析 返回字典类 引用：System.Web.Extensions 类库

        /// </summary>

        /// <param name="jsonData">json数据</param>

        /// <returns></returns>

        private static Dictionary<string, object> JsonToDictionary(string jsonData)

        {

            JavaScriptSerializer jss = new JavaScriptSerializer();

            return jss.Deserialize<Dictionary<string, object>>(jsonData);

        }

快递查询API应用：

  /// <summary>

        /// 查询邮件的邮寄状况

        /// </summary>

        /// <param name="con">邮寄公司</param>

        /// <param name="number">邮寄号</param>

        /// <returns></returns>

        public static string SelectYJ(string con, string number)

        {

            string url = "http://www.kuaidi100.com/query?type=" + con + "&postid=" + number;//查询地址

            Dictionary<string, object> diclist = new Dictionary<string, object>();

            diclist = JsonToDictionary(WebHtmlCon(url));

            if (diclist["message"].ToString() == "ok")

            {

                string KuaiDi = "<table id=\"showtablecontext\" style=\"border-collapse: collapse; width:520px; border-spacing: 0; border:0;\">";

                KuaiDi += "<tbody>";

                KuaiDi += "<tr><th width='163' style=\"background: #64AADB; border: 1px solid #75C2EF; color: #FFFFFF; font-size: 14px; font-weight: bold; height: 28px; line-height: 28px; text-indent: 15px;\">时间</th><th width='354' style=\"background: #64AADB; border: 1px solid #75C2EF; color: #FFFFFF; font-size: 14px; font-weight: bold; height: 28px; line-height: 28px; text-indent: 15px;\">地点和跟踪进度</th></tr>";

                ArrayList list = (ArrayList)diclist["data"];

                foreach (Dictionary<string, object> item in list)

                {

                    KuaiDi += " <tr><td style=\"border: 1px solid #DDDDDD; font-size: 12px; line-height: 22px; padding: 3px 5px;\">" + item["time"].ToString() + "</td><td>" + item["context"].ToString() + "</td></tr>";

                }

                KuaiDi += "</tbody>";

                KuaiDi += "</table>";

                return KuaiDi;

            }

            else

            {

                return "<p style=\"line-height:28px;margin:0px;padding:0px;color:#F21818; font-size: 14px;\">快递公司网络异常，请稍后查询.</p>";

            }

        }

结果为：

C# 页面抓取类的更多相关文章

新浪新闻页面抓取（JAVA-Jsoup）
1.使用gradle建立工程: 工程格式如下: include ':spider-demo' rootProject.name = 'my-spider-demo' settings def void ...
分享一个c#t的网页抓取类
using System; using System.Collections.Generic; using System.Web; using System.Text; using System.Ne ...
C# 页面抓取获取快递信息
通过页面抓取信息可以获得很多我们想要的信息,比如现在常会用到的快递查询,主要抓取的网站为http://www.kuaidi100.com/ 通过IE的网络分析我们可以得到下面信息通过对这个网站的分析 ...
[python]初试页面抓取——抓取沪深股市交易龙虎榜数据
[python]抓取沪深股市交易龙虎榜数据 python 3.5.0下运行没做自动建立files文件夹,需要手动在py文件目录下建立files文件夹后运行 #coding=utf-8 import ...
java 网页页面抓取标题和正文
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import ...
【Python3 爬虫】01_简单页面抓取
运行平台:Winodows 10 Python版本:Python 3.4.2 IDE:Sublime text3 网络爬虫网络爬虫,也叫网络蜘蛛(Web Spider),如果把互联网比喻成一个蜘蛛网 ...
Java HTML页面抓取实例
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import ...
php curl抓取类分享
class UsualFunForNetWorkHelper { /*** * post请求数据 */ public static function HttpsPost($url, $data = n ...
AutoIT: 通过页面抓取来陈列任务管理器里面所有进程的列表
#include<Array.au3> $handle =WinGetHandle("Windows 任务管理器") ;$ctrl =ControlGetHandle( ...

随机推荐

利用canvas实现的中点Bresenham算法
Bresenham提出的直线生成算法的基本原理是,每次在最大位移方向上走一步,而另一个方向是走步还是不走步取决于误差项的判别,具体的实现过程大家可以去问度娘.我主要是利用canvas画布技术实现了这个 ...
THE ONE THING PEOPLE WILL MASSIVELY OVERPAY FOR (有一个东西人们是愿意出高价购买的)
THE ONE THING PEOPLE WILL MASSIVELY OVERPAY FOR有一个东西人们是愿意出高价购买的 by GARY VAYNERCHUK 点此直达湾区日报简评 I don' ...
正则表达式2——grep命令
grep是Global search Regular Expression and Print out the line的简称. 1. grep命令基本用法命令格式: grep [选项][模式][文 ...
c++引用小问题！
两段程序 string version(const string &s1,const string &s2) { string temp; temp =s2+s1+s2; return ...
UVa11324 最大团 The Largest Clique-有向图强连通分量&DP
https://vjudge.net/problem/UVA-11324 给定一张有向图G,求一个节点数目最大的节点集,使得该集合中的任意两个节点u和v满足:要么u可以到达v,要么v可以到达u(u,v ...
windows内核对象可以等待
内核对象有两种状态触发与未触发. 是可以等待的.
WF4 持久化 <第四篇>
一.基础示例 WF4 默认支持SQLServer的持续化,首先要执行目录C:\Windows\Microsoft.NET\Framework\v4.0.30319\SQL\en下的脚本: SqlPer ...
python发邮件遇到的端口号问题
在学习使用python发邮件的过程中, 遇到了一个问题:由于测试的时候使用的是QQ邮箱,要求必须使用SSL/TLS加密,所以有了下面的代码, from email.mime.text import M ...
poj1936_All in All
时间复杂度O(n) #include <stdio.h> #include <string.h> int main(){ int al,bl,i,j; +]; +]; whil ...
IIS HTTP文件服务器搭建步骤
利用IIS搭建HTTP文件服务器,可下载.上传(用户名验证) 1.右键网站,添加应用程序 2.物理路径,选择系统的目录配置,上一层别名:CAPI3FileService 3.效果如下: 4.(以下步 ...

C# 页面抓取类

C# 页面抓取类的更多相关文章

随机推荐

热门专题