2018-7-19 21:39:49 我觉得这次的笔记是非常非常完美的!!!明天继续 睡觉去啦!

傍黑时候和晴宝打电话,她特能说,很喜欢这种感觉,有好多东西要和你分享!

1.复习!

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 10:12
# !@Author TrueNewBee # 今天和明天 多线程
# 协程 + IO模型 # 进程池所有内容:
# 管道
# 数据的共享 Manager dic list
# 进程池
# cpu个数+1
# ret = map(func, iterable)
# 异步 自带close和join
# 所有结果的[]
# apply()
# 同步的 : 只有当func执行完之后,才会继续向下执行其他的代码
# apply(func, args=())
# 返回值就是func的return
# apply_async
# 异步的:当func被注册进入一个进程之后,程序就继续向下执行
# apply_async(func, args())
# 返回值: apply_async返回的对象
# 为了用户能从中获取func的返回对象 obj.get()
# get会阻塞直到对应的func执行完毕拿到结果
# 使用apply_async给进程池分配任务,需要线close()后join来保持多进程和主进程代码的同步性

2.回调函数

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 10:22
# !@Author TrueNewBee # 回调函数
from multiprocessing import Pool def func1(n):
return n+1 def func2(m):
print(m) if __name__ == '__main__':
p = Pool(5)
for i in range(10, 20):
p.apply_async(func1, args=(i, ), callback=func2)
p.close()
p.join()

3.爬取数据例子

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 10:40
# !@Author TrueNewBee
import requests
from multiprocessing import Pool
# 200 网页正常
# 404 网页找不到了
# 502 504
# 回调函数在主进程进行,因为是异步,不让主进程闲着,多做点东西! def get(url1):
response = requests.get(url1)
if response.status_code == 200:
return url1, response.content.decode('utf-8') def call_back(args):
url2, content = args
print(url2, len(content)) url_list = [
'https://www.cnblogs.com/',
'http://www.baidu.com/',
'http://www.jd.com/'
] if __name__ == '__main__':
p = Pool(5)
for url in url_list:
p.apply_async(get, args=(url,), callback=call_back)
p.close()
p.join()

4.爬虫

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 11:23
# !@Author TrueNewBee # 爬取猫眼榜单数据,使用了线程池回调函数
import re
from urllib.request import urlopen
from multiprocessing import Pool def get_page(url,pattern):
response = urlopen(url).read().decode('utf-8')
return pattern, response # 正则表达式编译结果 网页内容 def parse_page(info):
pattern, page_content = info
res = re.findall(pattern, page_content)
for item in res:
dic = {
'index': item[0].strip(),
'title': item[1].strip(),
'actor': item[2].strip(),
'time': item[3].strip(),
}
print(dic) if __name__ == '__main__':
# 正则要写的好
regex = r'<dd>.*?<.*?class="board-index.*?>(\d+)</i>.*?title="(.*?)".*?class="movie-item-info".*?<p class="star">(.*?)</p>.*?<p class="releasetime">(.*?)</p>'
pattern1 = re.compile(regex, re.S) url_dic = {
'http://maoyan.com/board/7':pattern1,
} p = Pool()
res_l = []
for url, pattern in url_dic.items():
res = p.apply_async(get_page, args=(url, pattern), callback=parse_page)
res_l.append(res)
for i in res_l:
i.get()

5.线程

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 15:50
# !@Author TrueNewBee # import os
# import time
# from threading import Thread
# """多线程并发,都在同一个进程运行"""
#
#
# def func(n):
# time.sleep(1) # 全部线程并发睡1s 然后打印
# print(n, os.getpid())
#
#
# print('主线程:', os.getpid())
# for i in range(10):
# t = Thread(target=func, args=(i, ))
# t.start()
"""使用面向对象方式开启线程"""
# class MyTread(Thread):
# def __init__(self, arg):
# super().__init__()
# self.arg = arg
#
# def run(self):
# time.sleep(1)
# print(self.arg)
#
#
# t = MyTread(10)
# t.start() # threading模块:
# multiprocessing模块的完全模仿threading模块的接口,
# 二者在使用层面上有很大的相似地方
"""修改全局变量"""
# 在同一个进程多个线程之间的数据是共享的 # def func1(a):
# global g
# g = 0
# print(g, a, os.getpid())
#
#
# g = 100
# t_list = []
# for i in range(10):
# t = Thread(target=func1, args=(i, ))
# t.start()
# t_list.append(t)
# for t in t_list:
# t.join()
# print(g) # 进程 是最小的内存分配单位
# 线程 是操作系统调度的最小单位
# 线程被cpu执行了
# 进程内至少含有一个线程
# 进程中可以开启多个线程
# 开启一个线程所需要的时间要远远小于开启一个进程
# 多个线程内部有自己的数据栈,数据不共享
# 全局变量在多个线程之间是共享的
# 在CPython解释器下的python程序 在同一时刻 多线程只能有一个线程cpu被执行
# 高CPU(用多进程处理): 计算类 -----高CPU利用率 不占优势
# 高IO(用多线程处理): 爬取网页 200个网页
# qq聊天 send recv
# 处理日志文件 读文件
# 处理web请求
# 读取数据库 写数据库 import time
from threading import Thread
from multiprocessing import Process
"""多线程与多进程时间对比""" def func(n):
n+1 if __name__ == '__main__':
start = time.time()
t_list = []
for i in range(100):
t = Thread(target=func, args=(i, ))
t.start()
t_list.append(t)
for t in t_list:
t.join()
t1 = time.time() - start start1 = time.time()
p_list = []
for i in range(100):
p = Process(target=func, args=(i, ))
p.start()
p_list.append(t)
for p in p_list:
p.join()
t2 = time.time() - start1
print(t1, t2)

6.线程模块中其他方法

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 21:26
# !@Author TrueNewBee
import threading
import time def func(n):
time.sleep(0.5)
# 查看线程名字和id
print(n, threading.current_thread(), threading.get_ident()) for i in range(10):
threading.Thread(target=func, args=(i, )).start()
print(threading.current_thread())
print(threading.active_count()) # 查看所有线程数 11 加上主线程
print(threading.enumerate())

7. 多线程写 socket sever

sever端

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 21:06
# !@Author TrueNewBee
import socket
from threading import Thread def chat(conn1):
conn1.send(b'hello')
msg = conn1.recv(1024).decode('utf-8')
print(msg)
inp = input(">>").encode('utf-8')
conn1.send(inp)
conn1.close() if __name__ == '__main__':
sk = socket.socket()
sk.bind(('127.0.0.1', 8080))
sk.listen()
while True:
conn, add = sk.accept()
# 创建一个多线程实现多线程通讯
Thread(target=chat, args=(conn, )).start()
sk.close()

client端  (多线程中可以用input  而多进程中不可以用input)

# !/usr/bin/env python
# !--*--coding:utf-8 --*--
# !@Time :2018/7/19 21:07
# !@Author TrueNewBee
import socket sk = socket.socket()
sk.connect(('127.0.0.1', 8080)) msg = sk.recv(1024)
print(msg)
inp = input('>>>>').encode('utf-8') # 多线程可以用input,多进程不可以用
sk.send(inp)
sk.close()

7.19python昨日复习和多线程(2)的更多相关文章

  1. 7.19python昨日复习和多线程

    关于GIL锁的经典面试题!!

  2. Java复习8.多线程

    Java复习8 多线程知识 20131007 前言: 在Java中本身就是支持多线程程序的,而不是像C++那样,对于多线程的程序,需要调用操作系统的API 接口去实现多线程的程序,而Java是支持多线 ...

  3. Python并发复习1 - 多线程

    一.基本概念 程序: 指令集,静态, 进程: 当程序运行时,会创建进程,是操作系统资源分配的基本单位 线程: 进程的基本执行单元,每个进程至少包含一个线程,是任务调度和执行的基本单位 > 进程和 ...

  4. Python并发复习2 - 多线程模块threading

    一.多线程的调用 threading 模块建立在thread 模块之上.thread模块以低级.原始的方式来处理和控制线程,而threading 模块通过对thread进行二次封装, 提供了更方便的a ...

  5. JAVA_SE复习(多线程)

    线程 1.两种创建线程的方式都有自身的优点.  实现 Runnable 接口的优点:  从面向对象的设计观点看,Thread 类严格来讲是一个虚拟CPU 的封装,因此只有要改变或扩展该CPU 模型 ...

  6. C# 基础复习 四 多线程

    单线程和多线程的区别     单线程:         只用主线程处理,如果一个操作在占用主线程,那么其他操作则无法执行     多线程:         除了主线程外,还开启了子线程来执行操作,子线 ...

  7. JavaSE复习_10 多线程复习

    △wait()和sleep()的区别:  1.wait():没有等待时间,而sleep()需要有等待时间作为参数.  2.在同步中对于CPU的执行权和锁的处理不同:   wait()会释放执行权和锁. ...

  8. 复习IOS多线程知识

    线程的注意点 1.不要同时开太多的线程(1~3条线程即可,不要超过5条) 2.线程概念 * 主线程 : UI线程,显示.刷新UI界面,处理UI控件的事件 * 子线程 : 后台线程,异步线程 3.不要把 ...

  9. Java复习 之多线程

    线程是一个程序中的不同路径 例子1 只有一条路径 每一个分支都是一个线程 实际上在一个时刻内 电脑只能运行一个进程 但是因为cpu运算速度很快 将时间分出来了 所以我们感觉是同时运行 创建线程的两种方 ...

随机推荐

  1. VC++ 链接错误LINK : fatal error LNK1104: cannot open file "*.lib"

    问题描述: 运行VC++编译时经常出现 Linking… LINK : fatal error LNK1104: cannot open file “*.lib” Error executing li ...

  2. MTK 隐藏上方的状态栏

    步骤一: 源码/frameworks/base/packages/SystemUI/src/com/android/systemui/statusbar/phone/PhoneStatusBar.ja ...

  3. 从Python学习中得到的一点启发 - Java逆向索引ArrayList

    看了几天Python,感觉记忆力不行了,很多东西记不住了.但是终归是得到了一点知识:重写一个ArrayList,允许从负值的索引得到指定的项.然后写一个得到斐波拉契数组的方法,这种方法要比递归调用的方 ...

  4. OpenSift源代码编译过程记录

    本文记录了在CentOS6.5上编译Sift的开源实现OpenSift的编译过程,同一时候记录了编译过程中的几个问题. sift的理论已经有非常多了,以下会给出链接: 1.Requirements a ...

  5. C#中的Abstract、Virtual、Interface理解

    容易混淆是必须的,都是与继承有关系,并且涉及到override的使用 一.Virtual方法(虚方法) virtual 关键字用于在基类中修饰方法.virtual的使用会有两种情况: 情况1:在基类中 ...

  6. python中安装dlib和cv2

    这两个模块是很容易出问题的模块,以下的解决办法都是从网上收集而来. 安装dlib: pypi.python.org/pypi/dlib/19.6.0 下载 dlib-19.6.0-cp36-cp36m ...

  7. Bypass 护卫神SQL注入防御(多姿势)

    0x00 前言 ​ 护卫神一直专注服务器安全领域, 其中有一款产品,护卫神·入侵防护系统 ,提供了一些网站安全防护的功能,在IIS加固模块中有一个SQL防注入功能. 这边主要分享一下几种思路,Bypa ...

  8. Ansible Playbook 简介

    我们去远程执行命令时要使用 command 模块,拷贝文件时要使用 copy 模块,如果我们要操作的东西很多,那就要执行很多条不同模块的命令Playbook 是一个 yaml 配置文件,我们可以把不同 ...

  9. PowerShell的初步学习

    今天要重新学习一钟语法,由于工作中项目的需要,不得不说学习新的语言是必不可少的.          Windows PowerShell 是一种命令行外科程序和脚本环境,使命令行用户和脚本编写者可以利 ...

  10. sqlserver连接问题收集

    问题1. 使用navicat连接本地sqlserver,报错“命名管道提供程序无法打开与 sql server 的连接 [2]” 解决: 参考本篇文章 <持续收集中>