用urllib库几行代码实现最简单爬虫
"""
使用urllib.request()请求一个网页内容,并且把内容打印出来。
"""
from urllib import request
import chardet
if __name__ == '__main__':
    # 有的网站url使用不了
    url = "https://www.cnblogs.com/gshelldon/p/13332798.html"
    # 打开url把内容赋值给rsp
    rsp = request.urlopen(url)
    # 存取到内存当中是bytes流,使用read方法把rsp的内容读取出来,赋值给变量html。
    html = rsp.read()
    # 使用decode解码成我们能够看懂的格式。
    # print(type(html))         # 查看返回的格式
    html = html.decode('utf-8')  # 默认的是utf-8
    print(html)
返回的内容是html格式的文本
D:\ProgramData\Anaconda3\envs\spider\python.exe D:/爬虫/v1-最简单的爬虫.py
<!DOCTYPE html>
<html lang="zh-cn">
<head>
    <meta charset="utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <meta name="referrer" content="origin" />
    <meta property="og:description" content="nginx 动静分离 不需要运维来做,开发做的。 动态请求:该请求会调用数据库中的数据。 静态请求:用户请求不会调用数据库。 动态页面:后端开发写的需要调用数据库的页面(python、java、C、p" />
    <meta http-equiv="Cache-Control" content="no-transform" />
省略。。。。。。。
用urllib库几行代码实现最简单爬虫的更多相关文章
- 用JavaCV改写“100行代码实现最简单的基于FFMPEG+SDL的视频播放器 ”
		FFMPEG的文档少,JavaCV的文档就更少了.从网上找到这篇100行代码实现最简单的基于FFMPEG+SDL的视频播放器.地址是http://blog.csdn.net/leixiaohua102 ... 
- 100行代码实现最简单的基于FFMPEG+SDL的视频播放器(SDL1.x)【转】
		转自:http://blog.csdn.net/leixiaohua1020/article/details/8652605 版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[-] ... 
- 【转】100行代码实现最简单的基于FFMPEG+SDL的视频播放器
		FFMPEG工程浩大,可以参考的书籍又不是很多,因此很多刚学习FFMPEG的人常常感觉到无从下手.我刚接触FFMPEG的时候也感觉不知从何学起. 因此我把自己做项目过程中实现的一个非常简单的视频播放器 ... 
- 37行代码实现一个简单的打游戏AI
		不废话,直接上码,跟神经网络一点关系都没有,这37行代码只能保证电脑的对敌牺牲率是1:10左右,如果想手动操控,注释掉autopilot后边的代码即可. 哪个大神有兴趣可以用tensorflow或者s ... 
- 10分钟教你用python 30行代码搞定简单手写识别!
		欲直接下载代码文件,关注我们的公众号哦!查看历史消息即可! 手写笔记还是电子笔记好呢? 毕业季刚结束,眼瞅着2018级小萌新马上就要来了,老腊肉小编为了咱学弟学妹们的学习,绞尽脑汁准备编一套大学秘籍, ... 
- Python 教你 4 行代码开发新闻网站通用爬虫
		\  GNE(GeneralNewsExtractor)是一个通用新闻网站正文抽取模块,输入一篇新闻网页的 HTML, 输出正文内容.标题.作者.发布时间.正文中的图片地址和正文所在的标签源代码.G ... 
- 51行代码实现简单的PHP区块链
		本文原始地址:php区块链demo 今年区块链特别火,我也很火啊.我火什么呢.前几年,公众平台出现,还得花时间去学去看,后来小程序出现,又得花时间精力去学去看.现在比特币.以太坊等去中心化货币带起了区 ... 
- 7 行代码搞崩溃 B 站,原因令人唏嘘!
		前不久,哔哩哔哩(一般常称为 B 站)发布了一篇文章<2021.07.13 我们是这样崩的>,详细回顾了他们在 2021.07.13 晚上全站崩溃约 3 小时的至暗时刻,以及万分紧张的故障 ... 
- SOCKET简单爬虫实现代码和使用方法
		抓取一个网页内容非常容易,常见的方式有curl.file_get_contents.socket以及文件操作函数file.fopen等. 下面使用SOCKET下的fsockopen()函数访问Web服 ... 
随机推荐
- [源码解析] 并行分布式任务队列 Celery 之 消费动态流程
			[源码解析] 并行分布式任务队列 Celery 之 消费动态流程 目录 [源码解析] 并行分布式任务队列 Celery 之 消费动态流程 0x00 摘要 0x01 来由 0x02 逻辑 in komb ... 
- Java【File类、递归】
			File 1.在io包中 操作电脑中的文件和文件夹 java.io.File 类是文件和目录路径名的抽象表示,主要用于文件和目录的创建.查找和删除等操作. 我们可以使用File类的方法 创建一 ... 
- 编程相关术语(Python)
			1. 程序的组成 程序 (program):(1)由一系列定义计算机如何执行计算的指令组成.(本质) (2)程序(算法)由对象.表达式和语句组成.(元素) 1.1程序的指令类型 输入 (input): ... 
- JDBC_13_封装JDBC工具类
			封装JDBC工具类 代码: import java.sql.*; /** * JDBC工具类,简化JDBC编程 */ public class DBUtil { //工具类中的构造方法都是私有的,因为 ... 
- 幻读:听说有人认为我是被MVCC干掉的
			@ 目录 前言 系列文章 一.我是谁? 二.为什么有人会认为我是被MVCC干掉的 三.我真的是被MVCC解决的? 四.再聊当前读.快照读 当前读 快照读 五.告诉你们吧!当前读的情况下我是被next- ... 
- 【原创】【基础】一文搞懂严蔚敏数据结构SqList &L和SqList L、ElemType &e和ElemType e
			旁白 最近小渔夫在看严蔚敏.李冬梅<数据结构 c语言版>(第2版),学到第二章顺序表的实现时,看到函数参数一会是SqList &L.一会又是SqList L.一会ElemType ... 
- mooc人大单元测试1
			@font-face { font-family: Wingdings } @font-face { font-family: 宋体 } @font-face { font-family: " ... 
- 869. Reordered Power of 2
			Starting with a positive integer N, we reorder the digits in any order (including the original order ... 
- 支持rotate和大小限制的golang log库
			支持大小限制和rotate的log库,还是很有必要的,前者让你不再操心磁盘被吃光,后者让查日志更方便. 但是在golang中没有太好的实现,看过一些开源的和自行实现的,都有几个不满意的地方,比如: 没 ... 
- Tomcat部署环境
			环境搭建:程序文件(开发人员),相关的软件(web服务器,应用服务器,数据服务器),硬件(服务器设备上),网络环境. 文档:部署文档说明书(操作系统,硬件配置,服务器软件及相关..) 下面举个列子,考 ... 
