总结一下,关于获取到的信息编码失败. 刚才在执行代码的时候,发现一个问题: 然后修改代码如下: '''爬取知乎界面的标题''' import requests import re import sys import io sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默认编码 headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW…
python基础——获取对象信息 当我们拿到一个对象的引用时,如何知道这个对象是什么类型.有哪些方法呢? 使用type() 首先,我们来判断对象类型,使用type()函数: 基本类型都可以用type()判断: >>> type(123) <class 'int'> >>> type('str') <class 'str'> >>> type(None) <type(None) 'NoneType'> 如果一个变量指向…
获取URL 进入某个知乎问题的主页下,按F12打开开发者工具后查看network面板. network面板可以查看页面向服务器请求的资源.资源的大小.加载资源花费的时间以及哪些资源加载失败等信息.还可以查看HTTP的请求头,返回内容等. 以"你有哪些可爱的猫猫照片?"问题为例,我们可以看到network面板如下: 按一下快捷键Ctrl + F在搜索面板中直接搜索对应的答案出现的文字,可以找到对应的目标url及其response: 安装对应的package,其他包都比较简单,需要注意的是…
Python基础篇_文件和数据格式化 文件的使用:文件打开.关闭.读写 文件打开:通过open()函数打开文件,并返回一个操作文件的变量. 使用语法:<变量名> = (<文件路径以及文件名>,<打开模式>) open()函数的七种打开模式: 打开模式 含义 ‘r’ 只读模式.如果文件不存在,则返回异常FileNotFoundError,默认值 ’w’ 覆盖写模式,文件不存在则创建,存在则完全覆盖原文件 ’x’ 创建写模式,文件不存在则创建,存在则返回异常FileExis…
上一篇笔记记录了Python中的pyyaml库对yaml文件进行读写,但了解到ruamel.yaml也能对yaml文件进行读写,于是想尝试一下它的用法. 一,注意 这里首先要更正一下网上大部分博客的说法:使用PyYAML写入时不是yaml的标准形式.例如使用PyYAML将字典嵌套字典的数据写入yaml文件时,写入的yaml文件里会出现带{}的数据.实际我在写代码的过程中发现PyYAML5.3.1版本并不会出现这种情况.如下所示: 使用PyYAML库写入yaml文件 # @author: 给你一页…
#!/usr/bin/python指定用什么解释器运行脚本以及解释器所在的位置 # -*- coding: utf-8 -*-用来指定文件编码为utf-8的PEP 0263 -- Defining Python Source Code Encodingshttp://www.python.org/dev/peps/pep-0263/ 估计有不少人注意过一些python脚本开头有这么行东东:#!/usr/bin/python它是用来干嘛的?貌似没有它对脚本功能也没啥影响.它是用来指定用什么解释器运…
原文网址:http://www.crifan.com/python_head_meaning_for_usr_bin_python_coding_utf-8/ #!/usr/bin/python 是用来说明脚本语言是python的 是要用/usr/bin下面的程序(工具)python,这个解释器,来解释python脚本,来运行python脚本的. # -*- coding: utf-8 -*- 是用来指定文件编码为utf-8的 详情可以参考: PEP 0263 — Defining Python…
1.#!/usr/bin/python 是用来说明脚本语言是 python 的 是要用 /usr/bin下面的程序(工具)python,这个解释器,来解释 python 脚本,来运行 python 脚本的. 2.# -*- coding: utf-8 -*- 是用来指定文件编码为 utf-8 的 详情可以参考:PEP 0263 — Defining Python Source Code Encodings 在此,详细的(主要是翻译)解释一下,为何要加这个编码声明,以及如何添加编码声明: 2.1…
本节内容 1.编码介绍 2.字符编码介绍 3.总结 说到python的编码,一句话总结,说多了都是泪啊,这个在以后的python的开发中绝对是一件令人头疼的事情.所以有必要要讲讲清楚 一.编码介绍 1.须知: 在python 2中默认编码是 ASCII,而在python 3中默认编码是 unicode unicode 分为utf-32 (占4个字节),utf-16(占两个字节),utf-8(占1-4个字节),所以utf-16 是最常用的unicode版本,但是在文件里存的还是utf-8,因为ut…
Python基础认识 1.字符串的格式化初识及占位符的简单应用 字符串的格式化 按照既定的要求进行有规定排版的一种输出方式. #我们想要输出的格式如下: ----------------------------- name:小明 age:15 hobby:篮球 ----------------------------- #为了达到以上目的需要进行格式化输出 name=input("name:") age=input("age:") hobby=input("…