Python Learning Day3

爬虫练习

说是练习，实际是尝试了一些还没有具体了解的方式吧hhhhh'

基于urllib实现

import urllib.request

import re

url="https://www.zhihu.com/question/21100397" # 我们要爬取图片的地址

page = urllib.request.urlopen(url) # 第一行 打开网址

html = page.read().decode("utf-8") # 第二行 获取html源码

imglist = re.findall('img src="(http.*?)"',html) # 第三行 在html中匹配出符合条件的字符串

x=0

for imgurl in imglist: # 遍历图片地址列表

    urllib.request.urlretrieve(imgurl,'pic%s.jpg' %x) # 第四行 获取图片并保存

    x=x+1

定义函数的三种方式

# 无参函数

# 不需要接收外部传入的参数

def foo():

     print('from foo..')

foo()

#

# 有参函数

# 需要接收外部传入的参数

def login(user, pwd):

     print(user, pwd)

# 传参多一或少一不可

#login('tank', '123')

# login('tank', '123', 111)  # 多，报错

# login('tank')  # 少，报错

# # x = 10

# # y = 20

# # if x > y:

# #     print(x)

# # else:

# #     print(y)

# 比较两数大小

def max2(x, y):

    if x > y:

        print(x)

    else:

        print(y)

max2(10, 30)

# 空函数

# 遇到一些比较难实现的功能，会导致暂时无法继续编写代码。

# 所以一般在生产开发中，都会将所有功能实现定义成空函数。

def func():

    pass  # pass代表什么都不做

函数的返回值
在调用函数时，需要接收函数体内部产生的结果，则return返回值。

def max2(x, y):

if x > y:

return x

else:

return y

res = max2(10, 5)

print(res)

函数对象
指的是函数名指向的内存地址。

 def func():

     pass

 # print(func)  # <function func at 0x101dd2e18>

 #

 # func()

 def func2():

     pass

 # 把函数对象，传入字典中

 dict1 = {

     '': func,

     '': func2

 }

 choice = input('请输入功能编号:').strip()

 # if choice == '1':

 #     func()

 # elif choice == '2':

 #     func2()

 #

 # 若用户选择函数对象对应的key值，则调用该函数

 if choice in dict1:

     dict1[choice]()  # dict1['1']

函数嵌套:
　　嵌套定义:
　　　　在函数内，定义函数。

嵌套调用:

def func1():

     print('func1...')

     def func2():

         print('func2...')

         def func3():

             print('func3...')

             # ....

         return func3

     return func2

 # 通过函数内部的函数值，调用函数

 func2 = func1()

 func3 = func2()

 func3()

 # 函数嵌套调用

 def func1():

     print('func1...')

     def func2():

         print('func2...')

         def func3():

             print('func3...')

             # ....

         func3()

     func2()

 func1()

名称空间
python解释器自带的: 内置名称空间
自定义的py文件内，顶着最左边定义的：全局名称空间
函数内部定义的: 局部名称空间

name = 'tank'

def func1():

    # name = 'abc'

    print()

    def func2():

        print('func2...')

# print(name, '全局打印')

func1()

引用自己编辑的包以及文件

import B

# from

# 导入B模块中的a文件

# 会自动执行a文件中的代码

from B import a

# __name__: B.a

# a

常用模块（内置模块）

time 时间模块

import time  # 导入time模块

# 获取时间戳

print(time.time())

# 等待2秒

time.sleep(2)

print(time.time())

os 模块

# 与操作系统中的文件进行交互

# 判断tank.txt文件是否存在

print(os.path.exists('test.txt'))  # True

print(os.path.exists('test1.txt'))  # False

print(os.path.exists(r'C::\Users\liubin\Desktop\test.txt'))  # True

# 获取当前文件的根目录

print(os.path.dirname(__file__))  # D:/python_files/day03

sys模块

import sys

# 获取python在环境变量中的文件路径

print(sys.path)

# 把项目的根目录添加到环境变量中

sys.path.append(os.path.dirname(__file__))

print(sys.path)

json模块

import json

# user_info = {

#     'name': 'tank',

#     'pwd': '123'

# }

# dumps: 序列化

# 1、把字典转行成json数据

# 2、再把json数据转换成字符串

res = json.dumps(user_info)

print(res)

print(type(res))

with open('user.json', 'wt', encoding='utf-8') as f:

     f.write(res)

# loads: 反序列化

# json.loads()

# 1、把json文件的数据读到内存中

with open('user.json', 'r', encoding='utf-8') as f:

#     # 读取得到的是字符串

     res = f.read()

#     # print(type(res))

#     # loads把json格式的字符串转换成dict类型

     user_dict = json.loads(res)

     print(user_dict)  # {'name': 'tank', 'pwd': '123'}

     print(type(user_dict))  # <class 'dict'>

# dump

user_info = {

    'name': 'tank',

     'pwd': ''

 }

 with open('user_info.json', 'w', encoding='utf-8') as f:

     # str1 = json.dumps(user_info)

     # f.write(str1)

     # dump： 自动触发f.write方法

     json.dump(user_info, f)

# load

with open('user_info.json', 'r', encoding='utf-8') as f:

    # res = f.read()

    # user_dict = json.loads(res)

    # print(user_dict)

    # load：自动触发f.read()

    user_dict = json.load(f)

    print(user_dict)

http协议:
请求url:
https://www.baidu.com/

请求方式:
GET

请求头:
　　Cookie：可能需要关注。
　　User-Agent: 用来证明你是浏览器
　　　　注意: 去浏览器的request headers中查找
　　Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 　　　　　　Chrome/65.0.3325.146 Safari/537.36
　　Host: www.baidu.com

requests模块使用

 import requests

response = requests.get(url='https://www.baidu.com/')

response.encoding = 'utf-8'

print(response)  # <Response [200]>

# # 返回响应状态码

print(response.status_code)  #

# 返回响应文本

# print(response.text)

print(type(response.text))  # <class 'str'>

with open('baidu.html', 'w', encoding='utf-8') as f:

    f.write(response.text)

爬取梨视频

import requests

res = requests.get('视频地址')

print(res.content)

with open('视频.mp4', 'wb') as f:

    f.write(res.content)

Python Learning Day3的更多相关文章

python笔记 - day3
python笔记 - day3 参考:http://www.cnblogs.com/wupeiqi/articles/5453708.html set特性: 1.无序 2.不重复 3.可嵌套函数: ...
python s12 day3
python s12 day3 深浅拷贝对于数字和字符串而言,赋值.浅拷贝和深拷贝无意义,因为其永远指向同一个内存地址. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ...
python learning Exception & Debug.py
''' 在程序运行的过程中,如果发生了错误,可以事先约定返回一个错误代码,这样,就可以知道是否有错,以及出错的原因.在操作系统提供的调用中,返回错误码非常常见.比如打开文件的函数open(),成功时返 ...
Python Learning Paths
Python Learning Paths Python Expert Python in Action Syntax Python objects Scalar types Operators St ...
Python Learning
这是自己之前整理的学习Python的资料,分享出来,希望能给别人一点帮助. Learning Plan Python是什么?- 对Python有基本的认识版本区别下载安装 IDE 文件构造 Py ...
python基础 Day3
python Day3 1.作业回顾设定一个理想的数字比如88,让用户输入数字,如果比88大,则显示猜测的结果大:如果比66小,则显示猜测的结果小了,给用户三次猜测机会,如果显示猜测正确退出循环,如 ...
Python学习day3作业
days3作业作业需求 HAproxy配置文件操作根据用户输入,输出对应的backend下的server信息可添加backend 和sever信息可修改backend 和sever信息可删除 ...
python基础:day3作业
修改haproxy配置文件基本功能:1.获取记录2.添加记录3.删除记录代码结构:三个函数一个主函数知识点:1.python简单数据结构的使用:列表.字典等 2.python两个模块的使用:os ...
How to begin Python learning?
如何开始Python语言学习? 1. 先了解它,Wiki百科:http://zh.wikipedia.org/zh-cn/Python 2. Python, Ruby等语言来自开源社区,社区的学法是V ...

随机推荐

PHP时间格式
date 用法: date(格式,[时间]); 如果没有时间参数,则使用当前时间.格式是一个字符串,其中以下字符有特殊意义: Y - 年,四位数字; 如: "1999" y - 年 ...
吴裕雄--天生自然java开发常用类库学习笔记：同步与死锁
class MyThread implements Runnable{ private int ticket = 5 ; // 假设一共有5张票 public void run(){ for(int ...
《ES6标准入门》(阮一峰)--9.数组的扩展
1.扩展运算符含义扩展运算符(spread)是三个点(...).它好比 rest 参数的逆运算,将一个数组转为用逗号分隔的参数序列. console.log(...[1, 2, 3]) // 1 ...
FC 与 FB 与 OB 的区别，时间标记冲突与一致性检查有详细的步骤
关键字1 组织块的程序是由用户自己编写. 关键字2 时间标记冲突与一致性检查有详细的步骤. 关键字3 FC 与 FB 与 OB 的区别? (一)功能功能块区别 ? FB 和FC均为用户编写 ...
P1054 求平均值
P1054 求平均值转跳点:
C++学习记录——（queue的清空）
c++自带的queue并没有clear这个方法:所以只能自己写了. 一共三种(其实我决得就是两种): 第一种: 直接赋值 queue<int> MyQue; /* …… */ MyQue ...
OSDA - 一个以MIT协议开源的串口调试助手
市场其实有很多开源的串行端口调试助手(Open Serial Port debug assistant),但其中很大一部分没有明确的开源协议,还有一部分只限个人使用,所以编写了一个并以MIT协议授权开 ...
CSS - 强制换行和禁止换行强制换行和禁止换行样
强制换行 word-break: break-all; 只对英文起作用,以字母作为换行依据. word-wrap: break-word; 只对英文起作用,以单词作为换行依据. whi ...
JSP编码规范
JSP包含文件 <%@ include file=”relativeURI”%> //在翻译阶段执行加载,比如:校验是否登录通过 jsp的include指令元素读入指定页面的内容.并把这些 ...
SpringBoot#RestControllerAdvice
__震惊! 不可避免的访问一些控制器会产生一些异常,这些异常不经处理传递到前台页面,会很难看. 涉及到的注解: org.springframework.web.bind.annotation.Rest ...

Python Learning Day3

基于urllib实现

Python Learning Day3的更多相关文章

随机推荐

热门专题