上面2篇文都简明了多进程中一些需要注意的地方,这次用多进程配合curl_mulit_*来做新浪微博的采集. 先把知识点和值得注意的坑列出 /* 需求:开3个进程,并且模拟多线程来采集新浪微博用户信息,cookie用本博客模拟登陆微博文章生成的cookie 知识要点: 1.需要把抓去过的 url放在容器里,请求前比对下即可避免重复抓取.(此程序没有判断,本人比较懒,哎) 2.容器不能为变量,开多个进程会出现问题,因为进程之间数据独立,无法共享.可以使用shmop共享内存实现(cli不支持模式APC…