7.19python昨日复习和多线程(2)
2018-7-19 21:39:49 我觉得这次的笔记是非常非常完美的!!!明天继续 睡觉去啦!
傍黑时候和晴宝打电话,她特能说,很喜欢这种感觉,有好多东西要和你分享!
1.复习!
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 10:12
# !@Author TrueNewBee # 今天和明天 多线程
# 协程 + IO模型 # 进程池所有内容:
# 管道
# 数据的共享 Manager dic list
# 进程池
# cpu个数+1
# ret = map(func, iterable)
# 异步 自带close和join
# 所有结果的[]
# apply()
# 同步的 : 只有当func执行完之后,才会继续向下执行其他的代码
# apply(func, args=())
# 返回值就是func的return
# apply_async
# 异步的:当func被注册进入一个进程之后,程序就继续向下执行
# apply_async(func, args())
# 返回值: apply_async返回的对象
# 为了用户能从中获取func的返回对象 obj.get()
# get会阻塞直到对应的func执行完毕拿到结果
# 使用apply_async给进程池分配任务,需要线close()后join来保持多进程和主进程代码的同步性
2.回调函数
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 10:22
# !@Author TrueNewBee # 回调函数
from multiprocessing import Pool def func1(n):
return n+1 def func2(m):
print(m) if __name__ == '__main__':
p = Pool(5)
for i in range(10, 20):
p.apply_async(func1, args=(i, ), callback=func2)
p.close()
p.join()
3.爬取数据例子
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 10:40
# !@Author TrueNewBee
import requests
from multiprocessing import Pool
# 200 网页正常
# 404 网页找不到了
# 502 504
# 回调函数在主进程进行,因为是异步,不让主进程闲着,多做点东西! def get(url1):
response = requests.get(url1)
if response.status_code == 200:
return url1, response.content.decode('utf-8') def call_back(args):
url2, content = args
print(url2, len(content)) url_list = [
'https://www.cnblogs.com/',
'http://www.baidu.com/',
'http://www.jd.com/'
] if __name__ == '__main__':
p = Pool(5)
for url in url_list:
p.apply_async(get, args=(url,), callback=call_back)
p.close()
p.join()
4.爬虫
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 11:23
# !@Author TrueNewBee # 爬取猫眼榜单数据,使用了线程池回调函数
import re
from urllib.request import urlopen
from multiprocessing import Pool def get_page(url,pattern):
response = urlopen(url).read().decode('utf-8')
return pattern, response # 正则表达式编译结果 网页内容 def parse_page(info):
pattern, page_content = info
res = re.findall(pattern, page_content)
for item in res:
dic = {
'index': item[0].strip(),
'title': item[1].strip(),
'actor': item[2].strip(),
'time': item[3].strip(),
}
print(dic) if __name__ == '__main__':
# 正则要写的好
regex = r'<dd>.*?<.*?class="board-index.*?>(\d+)</i>.*?title="(.*?)".*?class="movie-item-info".*?<p class="star">(.*?)</p>.*?<p class="releasetime">(.*?)</p>'
pattern1 = re.compile(regex, re.S) url_dic = {
'http://maoyan.com/board/7':pattern1,
} p = Pool()
res_l = []
for url, pattern in url_dic.items():
res = p.apply_async(get_page, args=(url, pattern), callback=parse_page)
res_l.append(res)
for i in res_l:
i.get()
5.线程
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 15:50
# !@Author TrueNewBee # import os
# import time
# from threading import Thread
# """多线程并发,都在同一个进程运行"""
#
#
# def func(n):
# time.sleep(1) # 全部线程并发睡1s 然后打印
# print(n, os.getpid())
#
#
# print('主线程:', os.getpid())
# for i in range(10):
# t = Thread(target=func, args=(i, ))
# t.start()
"""使用面向对象方式开启线程"""
# class MyTread(Thread):
# def __init__(self, arg):
# super().__init__()
# self.arg = arg
#
# def run(self):
# time.sleep(1)
# print(self.arg)
#
#
# t = MyTread(10)
# t.start() # threading模块:
# multiprocessing模块的完全模仿threading模块的接口,
# 二者在使用层面上有很大的相似地方
"""修改全局变量"""
# 在同一个进程多个线程之间的数据是共享的 # def func1(a):
# global g
# g = 0
# print(g, a, os.getpid())
#
#
# g = 100
# t_list = []
# for i in range(10):
# t = Thread(target=func1, args=(i, ))
# t.start()
# t_list.append(t)
# for t in t_list:
# t.join()
# print(g) # 进程 是最小的内存分配单位
# 线程 是操作系统调度的最小单位
# 线程被cpu执行了
# 进程内至少含有一个线程
# 进程中可以开启多个线程
# 开启一个线程所需要的时间要远远小于开启一个进程
# 多个线程内部有自己的数据栈,数据不共享
# 全局变量在多个线程之间是共享的
# 在CPython解释器下的python程序 在同一时刻 多线程只能有一个线程cpu被执行
# 高CPU(用多进程处理): 计算类 -----高CPU利用率 不占优势
# 高IO(用多线程处理): 爬取网页 200个网页
# qq聊天 send recv
# 处理日志文件 读文件
# 处理web请求
# 读取数据库 写数据库 import time
from threading import Thread
from multiprocessing import Process
"""多线程与多进程时间对比""" def func(n):
n+1 if __name__ == '__main__':
start = time.time()
t_list = []
for i in range(100):
t = Thread(target=func, args=(i, ))
t.start()
t_list.append(t)
for t in t_list:
t.join()
t1 = time.time() - start start1 = time.time()
p_list = []
for i in range(100):
p = Process(target=func, args=(i, ))
p.start()
p_list.append(t)
for p in p_list:
p.join()
t2 = time.time() - start1
print(t1, t2)
6.线程模块中其他方法
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 21:26
# !@Author TrueNewBee
import threading
import time def func(n):
time.sleep(0.5)
# 查看线程名字和id
print(n, threading.current_thread(), threading.get_ident()) for i in range(10):
threading.Thread(target=func, args=(i, )).start()
print(threading.current_thread())
print(threading.active_count()) # 查看所有线程数 11 加上主线程
print(threading.enumerate())
7. 多线程写 socket sever
sever端
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 21:06
# !@Author TrueNewBee
import socket
from threading import Thread def chat(conn1):
conn1.send(b'hello')
msg = conn1.recv(1024).decode('utf-8')
print(msg)
inp = input(">>").encode('utf-8')
conn1.send(inp)
conn1.close() if __name__ == '__main__':
sk = socket.socket()
sk.bind(('127.0.0.1', 8080))
sk.listen()
while True:
conn, add = sk.accept()
# 创建一个多线程实现多线程通讯
Thread(target=chat, args=(conn, )).start()
sk.close()
client端 (多线程中可以用input 而多进程中不可以用input)
# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 21:07
# !@Author TrueNewBee
import socket sk = socket.socket()
sk.connect(('127.0.0.1', 8080)) msg = sk.recv(1024)
print(msg)
inp = input('>>>>').encode('utf-8') # 多线程可以用input,多进程不可以用
sk.send(inp)
sk.close()
7.19python昨日复习和多线程(2)的更多相关文章
- 7.19python昨日复习和多线程
关于GIL锁的经典面试题!!
- Java复习8.多线程
Java复习8 多线程知识 20131007 前言: 在Java中本身就是支持多线程程序的,而不是像C++那样,对于多线程的程序,需要调用操作系统的API 接口去实现多线程的程序,而Java是支持多线 ...
- Python并发复习1 - 多线程
一.基本概念 程序: 指令集,静态, 进程: 当程序运行时,会创建进程,是操作系统资源分配的基本单位 线程: 进程的基本执行单元,每个进程至少包含一个线程,是任务调度和执行的基本单位 > 进程和 ...
- Python并发复习2 - 多线程模块threading
一.多线程的调用 threading 模块建立在thread 模块之上.thread模块以低级.原始的方式来处理和控制线程,而threading 模块通过对thread进行二次封装, 提供了更方便的a ...
- JAVA_SE复习(多线程)
线程 1.两种创建线程的方式都有自身的优点. 实现 Runnable 接口的优点: 从面向对象的设计观点看,Thread 类严格来讲是一个虚拟CPU 的封装,因此只有要改变或扩展该CPU 模型 ...
- C# 基础复习 四 多线程
单线程和多线程的区别 单线程: 只用主线程处理,如果一个操作在占用主线程,那么其他操作则无法执行 多线程: 除了主线程外,还开启了子线程来执行操作,子线 ...
- JavaSE复习_10 多线程复习
△wait()和sleep()的区别: 1.wait():没有等待时间,而sleep()需要有等待时间作为参数. 2.在同步中对于CPU的执行权和锁的处理不同: wait()会释放执行权和锁. ...
- 复习IOS多线程知识
线程的注意点 1.不要同时开太多的线程(1~3条线程即可,不要超过5条) 2.线程概念 * 主线程 : UI线程,显示.刷新UI界面,处理UI控件的事件 * 子线程 : 后台线程,异步线程 3.不要把 ...
- Java复习 之多线程
线程是一个程序中的不同路径 例子1 只有一条路径 每一个分支都是一个线程 实际上在一个时刻内 电脑只能运行一个进程 但是因为cpu运算速度很快 将时间分出来了 所以我们感觉是同时运行 创建线程的两种方 ...
随机推荐
- 如何在Java 环境下使用 HTTP 协议收发 MQ 消息
1. 准备环境在工程 POM 文件添加 HTTP Java 客户端的依赖. <dependency> <groupId>org.eclipse.jetty</groupI ...
- jsp新建项目
1.在原有项目的基础上新建一个文件夹 在文件夹内新建一个jsp文件 取名 JSP容器处理JSP文件需要以下三个阶段:翻译——编译——执行 JSP的页面元素包括 静态内容-HTML静态文本 指令-以“& ...
- python中,获取字符串的长度
说明: 与其他的语言一样,有时候需要查看或者说计算字符串的长度.在此记录下python中通过哪个函数实现. 操作过程: 1.通过len()函数返回字符串的长度 >>> text='p ...
- Android图片处理(Matrix,ColorMatrix) - 转载
Android图片处理(Matrix,ColorMatrix) 转载自:http://www.cnblogs.com/leon19870907/articles/1978065.html 在编程中有时 ...
- OpenSift源代码编译过程记录
本文记录了在CentOS6.5上编译Sift的开源实现OpenSift的编译过程,同一时候记录了编译过程中的几个问题. sift的理论已经有非常多了,以下会给出链接: 1.Requirements a ...
- MapWinGIS------引发类型为“System.Windows.Forms.AxHost+InvalidActiveXStateException”的异常
转载:http://www.cnblogs.com/dzone/archive/2011/09/08/2171445.html
- 网易 2016 实习研发project师 3道 编程题
1 比較重量 给定两颗钻石的编号g1,g2,编号从1開始.同一时候给定关系数组vector,当中元素为一些二元组.第一个元素为一次比較中较重的钻石的编号,第二个元素为较轻的钻石的编号.最后给定之前的比 ...
- 九度 1464:Hello World for U
题目描述: Given any string of N (>=5) characters, you are asked to form the characters into the shape ...
- vue-resource和vue-axios的简单使用方法
两者其实差别不大,都是基于es6的Promise对象实现的方法 vue-resource: main.js => import Vue from 'vue'; import VueResourc ...
- chm只看到目录,看不到内容解决办法
鼠标左键->属性->解除锁定->搞定!