Scrapy 爬虫框架 Scrapy 是一个用 Python 写的 Crawler Framework .它使用 Twisted 这个异步网络库来处理网络通信. Scrapy 框架的主要架构 根据它官网上的设计架构图,一个完整的 Spider 主要分成 7 个部分:Scrapy Engine,Scheduler,Downloader,Spider,Item Pipeline,Downloader middlewares,Spider middlewares. Scrapy 引擎( Engine…
scrapy爬虫框架学习笔记(一) 1.安装scrapy pip install scrapy 2.新建工程: (1)打开命令行模式 (2)进入要新建工程的目录 (3)运行命令: scrapy startproject projectname 这个命令会在运行命令的目录下新建一个工程目录 这个目录有一个初始的目录结构: 一个以工程 名命名的文件夹和一个名为scrapy.cfg的文件 工程名命名的文件夹下有两个文件夹,和五个py文件:…
1. 1).GOPATH设置 先设置自己的GOPATH,可以在本机中运行$PATH进行查看: userdeMacBook-Pro:~ user$ $GOPATH -bash: /Users/user/go: is a directory 在这可见我的GOPATH是/Users/user/go,并在该目录下生成如下作用的三个子目录: src:存放源代码(比如.go .c .h .s等) pkg:编译后生成的文件(比如.a) bin:编译后生成的可执行文件(为了方便可将此目录加入到$PATH中,本机…
做为linux菜鸟,由于work的需要,慢慢的开始接触学习linux. <鸟哥的linux私房菜>学习笔记. 一.基础命令操作 1.显示日期的命令 date 执行date命令后,显示结果为"2013年 06月 27日 星期四 14:14:55 CST". 如果需要以特定的格式显示日期,可以执行指令"date +%Y/%m/%d",显示结果为"2013/06/27". 2.显示日历的命令 cal 执行cal命令后,可以显示当月的日历.显…
一.jQuery概述    宗旨: Write Less, Do More.    基础知识:        1.符号$代替document.getElementById()函数        2.使用Css+Xpath来查询页面元素        3.适当的混用jQuery.Dom和JavaScript能够提升程序的执行效率.            如:Offset.Append.Before是jQuery的瓶颈        4.函数$()是$("document").ready的…
一.Scrapy框架简介 1. 下载页面 2. 解析 3. 并发 4. 深度 二.安装 linux下安装 pip3 install scrapy windows下安装 a.pip3 install wheel b.下载twisted和pywin32 http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted c.进入下载目录 执行pip3 install Twisted-18.7.0-cp36-cp36m-win_amd64.whl #cp36为适合py…
--定义变量SQL> var a number; --给绑定变量赋值SQL> exec :a :=123; PL/SQL procedure successfully completed. --使用该绑定变量SQL> select * from test where n1= :a; N1----------       123 Execution Plan----------------------------------------------------------Plan hash…
变量的作用域(scope)是指变量可以在程序中引用的范围.在方法中定义的变量称为局部变量(local variable).局部变量的作用域从声明变量的地方开始,直到包含该变量的块结束为止.局部变量都必须在使用之前进行声明和赋值.参数实际上就是一个局部变量.一个方法的参数的作用域涵盖整个方法. 在for循环头中初始动作部分生命的变量,其作用域是生个for循环.但是在for循环体内生命的变量,其作用域只限于循环体内,是从它的声明处开始,到包含该变量的块结束为止. 可以在一个方法中的不同块里声明同名的…
Greys介绍 greys-anatomy是一个Java线上诊断工具,取名来自美剧<实习医生格雷>,由菜鸟-杜琨同学开发维护.比我们常用的脚本工具btrace提供更多的功能,greys采用了命令式诊断. 安装greys curl -sLk http://ompc.oss.aliyuncs.com/greys/install.sh|sh 或者 下载 zip包 ./install_local.sh greys启动命令 ./greys <PID>[@IP:PORT] 会话与任务 Grey…
Java程序很大一部分要操作数据库,为了提高性能操作数据库的时候,有不得不使用数据库连接池.数据库连接池有很多选择,c3p.dhcp.proxool等,druid作为一名后起之秀,凭借其出色的性能,也逐渐引入了大家的眼帘.Druid是一个开源项目,源码托管在github上,源代码仓库地址是https://github.com/alibaba/druid .同时每次Druid发布正式版本和快照的时候,都会把源码打包,大家可以从上面的下载地址中找到相关版本的源码. 为什么说Druid是“最好的数据库…