Lynx是一款基于命令行的web浏览器

[root@test88 ~]# yum install lynx -y
[root@test88 ~]# lynx www.baidu.com

以纯文本的形式下载网页

[root@test88 ~]# lynx -dump www.baidu.com > baidu.txt
[root@test88 ~]# cat baidu.txt
#[1]百度搜索
REFRESH(0 sec): [2]http://www.baidu.com/baidu.html?from=noscript [bd_logo1.png]
[3]到百度首页 ____________________ 百度一下
输入法
* [4]手写
* [5]拼音
*
* [6]关闭 [7]百度首页[8]设置[9]登录
[10]新闻[11]hao123[12]地图[13]视频[14]贴吧[15]学术[16]登录[17]设置[18]更多产品
网页[19]新闻[20]贴吧[21]知道[22]音乐[23]图片[24]视频[25]地图[26]文库[27]更多» 手机百度 [28]把百度设为主页[29]关于百度[30]About Baidu[31]百度推广 ©2017 Baidu [32]使用百度前必读 [33]意见反馈 京ICP证030173号 [34]京公网安备11000002000001号 References # 不仅下载网页同时将网页中所有超链接列在这里 1. http://www.baidu.com/content-search.xml
2. http://www.baidu.com/baidu.html?from=noscript
3. http://www.baidu.com/
4. javascript:;
5. javascript:;
6. javascript:;
7. http://www.baidu.com/
8. javascript:;
9. https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F
10. http://news.baidu.com/
11. http://www.hao123.com/
12. http://map.baidu.com/
13. http://v.baidu.com/
14. http://tieba.baidu.com/
15. http://xueshu.baidu.com/
16. https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F
17. http://www.baidu.com/gaoji/preferences.html
18. http://www.baidu.com/more/
19. http://news.baidu.com/ns?cl=2&rn=20&tn=news&word=
20. http://tieba.baidu.com/f?kw=&fr=wwwt
21. http://zhidao.baidu.com/q?ct=17&pn=0&tn=ikaslist&rn=10&word=&fr=wwwt
22. http://music.baidu.com/search?fr=ps&ie=utf-8&key=
23. http://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=
24. http://v.baidu.com/v?ct=301989888&rn=20&pn=0&db=0&s=25&ie=utf-8&word=
25. http://map.baidu.com/m?word=&fr=ps01000
26. http://wenku.baidu.com/search?word=&lm=0&od=0&ie=utf-8
27. http://www.baidu.com/more/
28. http://www.baidu.com/cache/sethelp/help.html
29. http://home.baidu.com/
30. http://ir.baidu.com/
31. http://e.baidu.com/?refer=888
32. http://www.baidu.com/duty/
33. http://jianyi.baidu.com/
34. http://www.beian.gov.cn/portal/registerSystemInfo?recordcode=11000002000001

Lynx以纯文本的形式下载网页的更多相关文章

  1. Python下载网页的几种方法

    get和post方式总结 get方式:以URL字串本身传递数据参数,在服务器端可以从'QUERY_STRING'这个变量中直接读取,效率较高,但缺乏安全性,也无法来处理复杂的数据(只能是字符串,比如在 ...

  2. C# 网络编程之webBrowser获取网页url和下载网页中图片

    该文章主要是通过C#网络编程的webBrowser获取网页中的url并简单的尝试瞎子啊网页中的图片,主要是为以后网络开发的基础学习.其中主要的通过应用程序结合网页知识.正则表达式实现浏览.获取url. ...

  3. python-day3爬虫基础之下载网页

    今天主要学习了关于网页下载器的一些内容,下边做一下总结: 1.网页下载器,顾名思义,就是将URL所对应的网页以HTML的形式下载到本地,最终存储成本地文件或者还是本地内存字符串,然后进行后续的分析与处 ...

  4. JavaWeb学习之转发和重定向、会话技术:cookie、session、验证码实例、URLConnection使用(下载网页)(4)

    1.转发和重定向 HttpServletResponse response 转发: RequestDispatcher dispatcher = request.getRequestDispatche ...

  5. windows phone 7,sliverlight 下载网页的解析,关于wp7 gb2312编码

    原文:windows phone 7,sliverlight 下载网页的解析,关于wp7 gb2312编码 关于silverlight和wp7(windows phone 7)是默认不支持gb2312 ...

  6. Java的URL来下载网页源码

    import java.io.BufferedInputStream; import java.io.BufferedReader; import java.io.IOException; impor ...

  7. http下载网页

    //http.c #include <stdio.h>#include <stdlib.h>#include <string.h>#include <sys/ ...

  8. NPOI生成不规则Excel表格(并以流的形式下载,不将文件保存在服务器上,直接在客户端导出excel)

    //下载NPOI类库并添加引用 using NPOI.SS.UserModel; using NPOI.HSSF.UserModel; using NPOI.SS.Util; public stati ...

  9. PHP下载网页

    <?php /*   author:whq   作用:获取网页的内容 */   include "../Snoopy/Snoopy.class.php";class Cute ...

随机推荐

  1. 表单验证2-JS正则

    1. JS正则:   以/开头,以/结尾. test作用:到里面去找,只要里面有,就返回true:否则就返回false. 例如:rep=/\d+/; 检验里面是否有数字. 2.rep=/^  $/;  ...

  2. oracle job定时执行存储过程

     JOB定时跑插入语句1.建插入数据的存储过程create or replace procedure report_web asV_START_DATE DATE;V_END_DATE  DATE;b ...

  3. BZOJ4104:[Thu Summer Camp 2015]解密运算——题解

    https://www.lydsy.com/JudgeOnline/problem.php?id=4104 对于一个长度为N的字符串,我们在字符串的末尾添加一个特殊的字符".".之 ...

  4. 表格隔行变色_CSS实现鼠标悬停高亮

    <!doctype html> <html> <head> <meta http-equiv="content-type" content ...

  5. MyBatis之自查询,使用 递归实现 N级联动

    A:首先先看下一个简单的面试题 斐波那契数列 计算数组{1,1,2,3,5,8.......} 第30位值 规律:1 1 从第三项开始,每一项都是前两项之和 有两种实现方式 第一种方式: public ...

  6. bzoj3251: 树上三角形(思维题)

    神tmWA了8发调了20min才发现输出没回车T T... 首先考虑一段什么样的序列才会是N... 显然最长的形式就是斐波那契,前两数之和等于第三数之和,这样就无法组成三角形并且序列最长.可以发现在i ...

  7. 框架----Django之Form提交验证(一)

    一.Form提交验证与Ajax提交验证的运用实例 Form表单提交时会刷新页面,输入失败时,输入框内内容也会随之刷新不能保留:而Ajax提交是在后台偷偷提交,不会刷新页面,因此也就可以保留页面输入框内 ...

  8. oracle、mysql、db2三大数据库分页方法的整理

    最近项目中经常会涉及到代码中支持三种数据库的分页的功能,自己整理了关于三种数据库的分页的写法,分享给大家,以供大家使用.希望能帮到更多的码友! 先来看一个代码片段: String page = ala ...

  9. 洛谷P1012 拼数

    题目描述 设有n个正整数(n≤20),将它们联接成一排,组成一个最大的多位整数. 例如:n=3时,3个整数13,312,343联接成的最大整数为:34331213 又如:n=4时,4个整数7,13,4 ...

  10. thinkphp常见问题

    1.数据库查询中execute和query方法的区别 tp中execute()和query()方法都可以在参数里直接输入sql语句. 但是不同的是execute()通常用来执行insert或者upda ...