如果topN 设置为1000万 ,不会这1000万都放到QueueFeeder(内存)中,而是从文件系统中(hdfs)中迭代不断填充QueueFeeder.队列中默认存放 threadcount * 50 . 这个类的作用是从文件系统读文件填充队列. /** * This class feeds the queues with input items, and re-fills them as * items are consumed by FetcherThread-s. */ private
#######################总结######### 主要理解 锁 生产者消费者模型 解耦用的 队列 共享资源的时候 是不安全的 所以用到后面的锁 守护进程:p.daemon = True #将该进程设置为守护进程,必须写在start之前,意思如果我的主进程代码运行结束了,你这个子进程不管运行到什么地方,都直接结束 ######### 进程其他方法import time import os from multiprocessing import Process d