pool.map的第二个参数想传入多个咋整?
from functools import partial
from multiprocessing import Pool as ThreadPool
pageurls=[]
if maxpage:
for page in range(2, maxpage + 1):
pageurl = url + '&page=%s#mSearch' % page
pageurls.append(pageurl)
with ThreadPool() as pool:
results = pool.map(partial(get_one_page,level1=level1,level2=level2,level3=level3,name=name),pageurls) def get_one_page(pageurl,level1,level2,level3,name):
print("正在爬取的url", pageurl)
p_list = parser_md_index(pageurl)
for p in p_list:
product_url, img, p_br, p_name, p_price, old_price = p['product_url'], p['img'], p['p_br'], p[
'p_name'], p['p_price'], p['old_price']
product_with(level1, level2, level3, name, p_br, p_name, p_price, old_price, product_url, img)
name = re.sub('\"', '\'', name)
p_name = re.sub('\"', '\'', p_name)
sql = 'INSERT INTO modern_product (level1,level2,level3,level4,p_br,p_name,p_price,old_price,product_url,img) VALUES ("{}","{}","{}","{}","{}","{}","{}","{}","{}","{}")'.format(
level1, level2, level3, name, p_br, p_name, p_price, old_price, product_url, img)
cur.execute(sql)
conn.commit()
multiprocessing 用的最多的是pool.map,类似的还有pool.map_async这个是异步的,这两个需要传递的参数不同,另外python3不建议使用pool.apply了,具体我不很清楚自己查。
简单解释下上面代码用的参数,其中partial是一个偏函数,关于它的用法参照(我看着挺全的):https://blog.csdn.net/appleyk/article/details/77609114
pool.map(partial(get_one_page,level1=level1,level2=level2,level3=level3,name=name),pageurls)
上面这句核心部分,在理解这句之前你需要知道什么是偏函数,什么是迭代类型参数,map是如何工作
poo.map() 传递的是两个参数第一个参数是一个函数名(不带()),第二个参数是个迭代对象。
一般情况第二个参数,传入一个迭代就够用了。
但是我这个就比较牛逼了,需要传入一个列表和几个字符串给get_one_page函数
最好使用关键字参数和函数的参数一一对应起来。
pool.map(partial(get_one_page,level1=level1,level2=level2,level3=level3,name=name),pageurls)的level1,level2,level3,name
get_one_page(pageurl,level1,level2,level3,name)的level1,level2,level3,name就是level1,level2,level3,name几个参数=后面的值,为了好理解我们可以改成下面这样。
pool.map(partial(get_one_page,a=level1,b=level2,c=level3,d=name),pageurls)
get_one_page(pageurl,a,b,c,d)
好了 这样就懂了吧。
我也很菜 哪地方不对的请大家多多指点。
pool.map的第二个参数想传入多个咋整?的更多相关文章
- useEffect传入第二个参数陷入死循环
最近新项目刚上手,就用了react的hooks,之前也看过hooks的不少文章,只是还没实战实战. 业务场景1:需要在页面一开始时得到一个接口的返回值,取调用另一个接口. 我的思路是,先设置这个接口的 ...
- js replace方法第二个参数,远不止你想的那么强大
js replace() 方法,想必大家都不陌生. 定义和用法: replace()方法用于在字符串中用一些字符替换另一些字符,或者替换一个与正则表达式匹配的子串. stringObject.repl ...
- 关于字符串replace方法第二个参数探究
网上有关replace的文章很多了,这里主要聊聊它的第二个参数.阅读本文需要对replace方法有一定了解.W3school=>replace 我们要把一段字符串中的某些指定字符替换掉,第一时间 ...
- python3.x pool.map方法的实质
我使用多进程的一般方式,都是multiprocessing模块中的Pool.map()方法.下面写一个简单的示例和解析.至于此种方法使用多进程的效率问题,还希望大佬予以指正. 示例: "&q ...
- lavavel 定时任务 (command的第二个参数)
之前好像没有写过,记录一下 $schedule->command()方法 第一个参数不用说,可以传纯字符串或者类::class,不过第二个参数确很少人提到 /** * Add a new Art ...
- 关于replace()方法中第二个参数的转义问题
如果你想通过Javascript代码在网页中呈现 \ 字符,则在JS代码中你必须输入两个反斜杠 \\,否则会报错.比如: var a = "\"; alert(a); //chro ...
- 深度学习原理与框架-Alexnet(迁移学习代码) 1.sys.argv[1:](控制台输入的参数获取第二个参数开始) 2.tf.split(对数据进行切分操作) 3.tf.concat(对数据进行合并操作) 4.tf.variable_scope(指定w的使用范围) 5.tf.get_variable(构造和获得参数) 6.np.load(加载.npy文件)
1. sys.argv[1:] # 在控制台进行参数的输入时,只使用第二个参数以后的数据 参数说明:控制台的输入:python test.py what, 使用sys.argv[1:],那么将获得w ...
- java实验三——求平均数,数组排序(有关java保留小数位数,由于编译器版本未到1.5导致的报错format函数第二个参数不对,要求是Object[])
package hello; import java.util.Arrays; public class 实验三更正版 { public static void main(String[] args) ...
- getAttribute()方法的第二个参数
对于一个img元素,我们想获取它的src属性时可以有两种方式: 1.xxx.getAttribute("src") 2.直接通过xxx.src获取属性值 在src的属性值为相对路径 ...
随机推荐
- PostgreSQL基本配置
记一下Postgresql的基本操作,在Ubuntu下使用apt-get安装是不会像MySQL那样都配置好了,而是要安装后再配置: 1. 基本安装 # 安装postgresql和pgadmin(一个管 ...
- Java实现网页截屏功能(基于phantomJs)
公司最近有个需求:把用户第一次的测量身体信息和最近一次测量信息进行对比,并且需要把对比的数据截成图片可以发给用户(需要在不打开网页的情况下实时对网页进行截图然后保存到服务器上,返回图片地址),通过网上 ...
- python进阶训练
1.列表,字典,集合解析 from random import randint #列表解析,选出大于0的元素 data=[randint(-10,10)for i in range(10)] resu ...
- 【集训试题】exam 信心考 最小割
题意概述: 有N个人,A,B两个考场.如果学生i在A考场,总信心值增加xi:如果学生i在B考场,总信心值增加yi.其中还有m对好友,当第i对好友的两个人都在A考场时,总信心值增加ai:如果两人都在B考 ...
- xampp开户,apache打开出现端口被占用提示
刚装上去的时候,可以打开xampp,但是重启的时候出现以后以下问题 13:49:02 [Apache] Error: Apache shutdown unexpectedly.13:49:0 ...
- 关于react-redux中Provider、connect的解析
Provider 是什么 react-redux 提供的一个 React 组件 作用 把 store 提供给其子组件 //使用 redux 的 createStore 方法创建的一个 store co ...
- Linux SPI总线和设备驱动架构之三:SPI控制器驱动
通过第一篇文章,我们已经知道,整个SPI驱动架构可以分为协议驱动.通用接口层和控制器驱动三大部分.其中,控制器驱动负责最底层的数据收发工作,为了完成数据的收发工作,控制器驱动需要完成以下这些功能:1. ...
- c语言第五次作业-指针-总结博客
本次作业亮点 1.1整体情况 本次作业主要是对上次的大作业利用指针进行改进,但是大部分同学并没有很好按照老师的要求对大作业进行改进,函数的分装性也做得不够好,由于是初步学习指针,大家在本次的作业改造中 ...
- about !dbgprint to analyze BSOD dump file.
基本规则: 只有debug mode enable的机器,产生的dump file才会保存dbgprint的buffer. 默认!dbgprint的buffer size是4k. 增加buffer s ...
- 【题解】ZJOI2017仙人掌
感觉这题很厉害啊,虽然想了一天多但还是失败了……(:д:) 这题首先注意到给定图中如果存在环其实对于答案是没有影响的.然后关键之处就在于两个 \(dp\) 数组,其中 \(f[u]\) 表示以 \(u ...