public static void Get()
{
// string xpathtrI = "//*[@id='classify-list']/dl/dd/a/cite/span/i";
#region 获取首页的分类 ////主页的html地址
//string urlHome = "http://www.qidian.com/";
//HtmlWeb web = new HtmlWeb();
//HtmlAgilityPack.HtmlDocument htmlDoc = web.Load(urlHome);
////创建html的节点
//HtmlNode rootNode1 = htmlDoc.DocumentNode;
//string xpathtrA = "//*[@id='classify-list']/dl/dd";
//HtmlNodeCollection classList = rootNode1.SelectNodes(xpathtrA);
//List<string> listINode = new List<string>();
//foreach (HtmlNode item in classList)
//{
// //获取分类
// string inode = item.SelectSingleNode("//a/cite/span/i").InnerText;
// listINode.Add(inode);
//} #endregion #region 分类及明细 //string urlDetail = "http://xuanhuan.qidian.com/";
//List<string> urlList = new List<string>();
//urlList.Add("http://xuanhuan.qidian.com/");
//urlList.Add("http://qihuan.qidian.com/");
//urlList.Add("http://wuxia.qidian.com/");
//urlList.Add("http://xianxia.qidian.com/");
//urlList.Add("http://dushi.qidian.com/");
//urlList.Add("http://zhichang.qidian.com/");
//urlList.Add("http://junshi.qidian.com/");
//urlList.Add("http://lishi.qidian.com/");
//urlList.Add("http://youxi.qidian.com/");
//urlList.Add("http://tiyu.qidian.com/");
//urlList.Add("http://kehuan.qidian.com/");
//urlList.Add("http://lingyi.qidian.com/");//foreach (string url in urlList)
//{
// HtmlAgilityPack.HtmlDocument htmlDetail = web.Load(url);
// HtmlNode rootNode2 = htmlDetail.DocumentNode;
// string a = "//*[@class='book-info']";
// HtmlNodeCollection classList2 = rootNode2.SelectNodes(a);
// List<string> listINode2 = new List<string>();
// foreach (HtmlNode item in classList2)
// {
// //获取分类
// string inode = item.InnerHtml;
// listINode2.Add(inode);
// }
//} #endregion #region 文章内容 HtmlWeb web = new HtmlWeb();
string u = "http://read.qidian.com/chapter/zOGI9RYmNdFhO--gcH8iFg2/h3iHSEH1cSpMs5iq0oQwLQ2";
HtmlAgilityPack.HtmlDocument htmlDocment = web.Load(u);
//创建html的节点
HtmlNode htmlNode = htmlDocment.DocumentNode;
string x = "//*[@class='read-content j_readContent']";
HtmlNode htmlNodeP = htmlNode.SelectSingleNode(x);
string htmlD = htmlNodeP.InnerText; #endregion }

只是拿一个例子而已。

C#使用xpath简单爬取网站的内容的更多相关文章

  1. Python入门,以及简单爬取网页文本内容

    最近痴迷于Python的逻辑控制,还有爬虫的一方面,原本的目标是拷贝老师上课时U盘的数据.后来发现基础知识掌握的并不是很牢固.便去借了一本Python基础和两本爬虫框架的书.便开始了自己的入坑之旅 言 ...

  2. Python简单爬取Amazon图片-其他网站相应修改链接和正则

    简单爬取Amazon图片信息 这是一个简单的模板,如果需要爬取其他网站图片信息,更改URL和正则表达式即可 1 import requests 2 import re 3 import os 4 de ...

  3. requests 使用免费的代理ip爬取网站

    import requests import queue import threading from lxml import etree #要爬取的URL url = "http://xxx ...

  4. Python 利用 BeautifulSoup 爬取网站获取新闻流

    0. 引言 介绍下 Python 用 Beautiful Soup 周期性爬取 xxx 网站获取新闻流: 图 1 项目介绍 1. 开发环境 Python: 3.6.3 BeautifulSoup:   ...

  5. Java - XPath解析爬取内容

    code { margin: 0; padding: 0; white-space: pre; border: none; background: transparent; } pre { backg ...

  6. Golang+chromedp+goquery 简单爬取动态数据

    目录 Golang+chromedp+goquery 简单爬取动态数据 Golang的安装 下载golang软件 解压golang 配置golang 重新导入配置 chromedp框架的使用 实际的代 ...

  7. 使用scrapy爬取网站的商品数据

    目标是爬取网站http://www.muyingzhijia.com/上全部的商品数据信息,包括商品的一级类别,二级类别,商品title,品牌,价格. 搜索了一下,python的scrapy是一个不错 ...

  8. requests+xpath+map爬取百度贴吧

    # requests+xpath+map爬取百度贴吧 # 目标内容:跟帖用户名,跟帖内容,跟帖时间 # 分解: # requests获取网页 # xpath提取内容 # map实现多线程爬虫 impo ...

  9. 利用linux curl爬取网站数据

    看到一个看球网站的以下截图红色框数据,想爬取下来,通常爬取网站数据一般都会从java或者python爬取,但本人这两个都不会,只会shell脚本,于是硬着头皮试一下用shell爬取,方法很笨重,但旨在 ...

随机推荐

  1. 原生ajax请求

    $('#send').click(function(){ //请求的5个阶段,对应readyState的值 //0: 未初始化,send方法未调用: //1: 正在发送请求,send方法已调用: // ...

  2. Linux之nfs服务

    1.二进制安装nfs 2.作为共享存储挂载在三台web的网站根目录下实现,在任意一台web上修改的结果,其余两台都可以看到 [root@localhost ~]# yum install rpcbin ...

  3. C#_02.13_基础四_.NET方法

    C#_02.13_基础四_.NET方法 一.方法概述: 方法是一块具有名称的代码.可以通过方法进行调用而在别的地方执行,也可以把数据传入方法并接受数据输出. 二.方法的结构: 方法头  AND  方法 ...

  4. PHP07

    PHP07 1.cookie 2.使用php操作cookie 设置响应头(header)中的Set-Cookie可以下发小票 检查-network-响应头处可查看所设置cookie 检查-applic ...

  5. JAVA自学笔记19

    JAVA自学笔记19 1.集合总结 Collection(单列集合) List(有序可重复) ArrayList:底层数据结构是数组 ,查询快,增删慢.线程不安全,效率高 Vector:底层数据结构是 ...

  6. JAVA的基本数据类型和类型转换

    一.数据类型 java是一种强类型语言,第一次申明变量必须说明数据类型,第一次变量赋值称为变量的初始化. java数据类型分为基本数据类型和引用数据类型 基本数据类型有4类8种 第一类(有4种)整型: ...

  7. Aizu0121 Seven Puzzle(bfs+康托展开)

    https://vjudge.net/problem/Aizu-0121 比八数码要水的多,bfs. 但是做的时候我把康托展开记错了,wa了好几次. 附上康托展开博客详解:https://blog.c ...

  8. hdu6026 Deleting Edges(Dijkstra+思路)

    https://vjudge.net/problem/HDU-6026 我一直想不明白的是,它的乘法是如何保证n-1条边的.后来画了一张图大概能明白了. 结合最后的乘法二层循环的代码来看,当i=4的时 ...

  9. 问题7:JavaScript 常用正则示例

    1. trim功能(清除字符串两端空格) String.prototype.trim = function() { return this.replace(/(^\s+)|(\s+$)/g, ''); ...

  10. 分享一个整理Mac储存空间的软件,有效清理xcode的垃圾

    苹果的电脑还是比windows的要好,我这台用了3年时间,作为编程工作天天用,现在愣是一点儿也没有卡顿,如果换作是windows的电脑,我敢保证肯定是卡成狗,相信做编程的你肯定少补了一台mac. ma ...