Lynx以纯文本的形式下载网页
Lynx是一款基于命令行的web浏览器
[root@test88 ~]# yum install lynx -y
[root@test88 ~]# lynx www.baidu.com

以纯文本的形式下载网页
[root@test88 ~]# lynx -dump www.baidu.com > baidu.txt
[root@test88 ~]# cat baidu.txt
#[1]百度搜索
REFRESH(0 sec): [2]http://www.baidu.com/baidu.html?from=noscript [bd_logo1.png]
[3]到百度首页 ____________________ 百度一下
输入法
* [4]手写
* [5]拼音
*
* [6]关闭 [7]百度首页[8]设置[9]登录
[10]新闻[11]hao123[12]地图[13]视频[14]贴吧[15]学术[16]登录[17]设置[18]更多产品
网页[19]新闻[20]贴吧[21]知道[22]音乐[23]图片[24]视频[25]地图[26]文库[27]更多» 手机百度 [28]把百度设为主页[29]关于百度[30]About Baidu[31]百度推广 ©2017 Baidu [32]使用百度前必读 [33]意见反馈 京ICP证030173号 [34]京公网安备11000002000001号 References # 不仅下载网页同时将网页中所有超链接列在这里 1. http://www.baidu.com/content-search.xml
2. http://www.baidu.com/baidu.html?from=noscript
3. http://www.baidu.com/
4. javascript:;
5. javascript:;
6. javascript:;
7. http://www.baidu.com/
8. javascript:;
9. https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F
10. http://news.baidu.com/
11. http://www.hao123.com/
12. http://map.baidu.com/
13. http://v.baidu.com/
14. http://tieba.baidu.com/
15. http://xueshu.baidu.com/
16. https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F
17. http://www.baidu.com/gaoji/preferences.html
18. http://www.baidu.com/more/
19. http://news.baidu.com/ns?cl=2&rn=20&tn=news&word=
20. http://tieba.baidu.com/f?kw=&fr=wwwt
21. http://zhidao.baidu.com/q?ct=17&pn=0&tn=ikaslist&rn=10&word=&fr=wwwt
22. http://music.baidu.com/search?fr=ps&ie=utf-8&key=
23. http://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=
24. http://v.baidu.com/v?ct=301989888&rn=20&pn=0&db=0&s=25&ie=utf-8&word=
25. http://map.baidu.com/m?word=&fr=ps01000
26. http://wenku.baidu.com/search?word=&lm=0&od=0&ie=utf-8
27. http://www.baidu.com/more/
28. http://www.baidu.com/cache/sethelp/help.html
29. http://home.baidu.com/
30. http://ir.baidu.com/
31. http://e.baidu.com/?refer=888
32. http://www.baidu.com/duty/
33. http://jianyi.baidu.com/
34. http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=11000002000001
Lynx以纯文本的形式下载网页的更多相关文章
- Python下载网页的几种方法
get和post方式总结 get方式:以URL字串本身传递数据参数,在服务器端可以从'QUERY_STRING'这个变量中直接读取,效率较高,但缺乏安全性,也无法来处理复杂的数据(只能是字符串,比如在 ...
- C# 网络编程之webBrowser获取网页url和下载网页中图片
该文章主要是通过C#网络编程的webBrowser获取网页中的url并简单的尝试瞎子啊网页中的图片,主要是为以后网络开发的基础学习.其中主要的通过应用程序结合网页知识.正则表达式实现浏览.获取url. ...
- python-day3爬虫基础之下载网页
今天主要学习了关于网页下载器的一些内容,下边做一下总结: 1.网页下载器,顾名思义,就是将URL所对应的网页以HTML的形式下载到本地,最终存储成本地文件或者还是本地内存字符串,然后进行后续的分析与处 ...
- JavaWeb学习之转发和重定向、会话技术:cookie、session、验证码实例、URLConnection使用(下载网页)(4)
1.转发和重定向 HttpServletResponse response 转发: RequestDispatcher dispatcher = request.getRequestDispatche ...
- windows phone 7,sliverlight 下载网页的解析,关于wp7 gb2312编码
原文:windows phone 7,sliverlight 下载网页的解析,关于wp7 gb2312编码 关于silverlight和wp7(windows phone 7)是默认不支持gb2312 ...
- Java的URL来下载网页源码
import java.io.BufferedInputStream; import java.io.BufferedReader; import java.io.IOException; impor ...
- http下载网页
//http.c #include <stdio.h>#include <stdlib.h>#include <string.h>#include <sys/ ...
- NPOI生成不规则Excel表格(并以流的形式下载,不将文件保存在服务器上,直接在客户端导出excel)
//下载NPOI类库并添加引用 using NPOI.SS.UserModel; using NPOI.HSSF.UserModel; using NPOI.SS.Util; public stati ...
- PHP下载网页
<?php /* author:whq 作用:获取网页的内容 */ include "../Snoopy/Snoopy.class.php";class Cute ...
随机推荐
- 洛谷 P4114 Qtree1
Qtree系列都跟树有着莫大的联系,这道题当然也不例外 我是题面 读完题,我们大概就知道了,这道题非常简单,可以说是模板题.树剖+线段树轻松解决 直接看代码吧 #include<algorith ...
- 获取和验证Windows AD域的用户信息
1.获取windows AD域用户信息,首先需要有一个ad域管理员权限的账号,用这个账号连接ad域,获取所有域用户信息 用LdapContext,它继承自DirContext public Objec ...
- 【刷题】洛谷 P4143 采集矿石
题目背景 ZRQ成功从坍塌的洞穴中逃了出来.终于,他看到了要研究的矿石.他想挑一些带回去完成任务. 题目来源:Zhang_RQ哦对了ZRQ就他,嗯 题目描述 ZRQ发现这里有 \(N\) 块排成一排的 ...
- Gradle及eclipse插件安装
1. 下载Gradle Gradle需要jdk7或以上版本,使用Java –version命令进行测试:Gradle自带了Groovy库,所以无需再安装Groovy,已经安装的Groovy会被Gra ...
- 【ZJOI2005】沼泽鳄鱼 题解报告
题目描述 潘塔纳尔沼泽地号称世界上最大的一块湿地,它地位于巴西中部马托格罗索州的南部地区.每当雨季来临,这里碧波荡漾.生机盎然,引来不少游客. 为了让游玩更有情趣,人们在池塘的中央建设了几座石墩和石桥 ...
- Linux下chkconfig命令详解--(启动或停止)和查询系统服务的运行级信息
chkconfig命令主要用来更新(启动或停止)和查询系统服务的运行级信息.谨记chkconfig不是立即自动禁止或激活一个服务,它只是简单的改变了符号连接. 使用语法:chkconfig [--ad ...
- mac Source Tree免登陆方法
打开SourceTree -> 点击菜单栏的 窗口 选项 -> 点击显示托管在远端的仓库 -> 点击登录注册页面右上角的关闭按钮 -> 点击Quit -> 点击确定关闭刷 ...
- 如何在 ASP.NET 应用程序中实现模拟用户身份(在ASP.NET中以管理员身份运行网站)
前言 在实际的项目开发中,我们可能会需要调用一些非托管程序,而有些非托管程序需要有更高的身份权限才能正确执行.本文介绍了如何让IIS承载的ASP.NET网站以特定的账户执行,比如Administrat ...
- PID控制算法的C语言实现十一 模糊算法简介
在PID控制算法的C语言实现九中,文章已经对模糊PID的实质做了一个简要说明.本来打算等到完成毕业设计,工作稳定了再着力完成剩下的部分.鉴于网友的要求和信任,抽出时间来,对模糊PID做一个较为详细的论 ...
- POJ2975:Nim(Nim博弈)
Nim Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 7279 Accepted: 3455 题目链接:http://p ...