jQuery 2.0.3 源码分析Sizzle引擎

声明：本文为原创文章，如需转载，请注明来源并保留原文链接Aaron，谢谢！

通过Expr.find[ type ]我们找出选择器最右边的最终seed种子合集

通过Sizzle.compile函数编译器，我们把tokenize词法元素编译成闭包函数

超级匹配superMatcher，用佳的方式从seed种子集合筛选出需要的数据

也就是通过seed与compile的匹配，得出最终的结果了

superMatcher 函数

这个方法并不是一个直接定义的方法，通过matcherFromGroupMatchers( elementMatchers, setMatchers )方法return出来的一个curry化的函数，但是最后执行起重要作用的是它。

注意是compile()().

    compile( selector, match )(

        seed,

        context,

        !documentIsHTML,

        results,

        rsibling.test( selector ) && testContext( context.parentNode ) || context

    );

superMatcher方法会根据参数seed 、expandContext和context确定一个起始的查询范围

elems = seed || byElement && Expr.find["TAG"]( "*", outermost ),

有可能是直接从seed中查询过滤，也有可能在context或者context的父节点范围内。如果不是从seed开始，那只能把整个DOM树节点取出来过滤了，把整个DOM树节点取出来过滤了，它会先执行Expr.find["TAG"]( "*", outermost )这句代码等到一个elems集合（数组合集）

context.getElementsByTagName( tag );

可以看出对于优化选择器，最右边应该写一个作用域的搜索范围context比较好

开始遍历这个seed种子合集了

while ( (matcher = elementMatchers[j++]) ) {

    if ( matcher( elem, context, xml ) ) {

        results.push( elem );

        break;

    }

}

elementMatchers：就是通过分解词法器生成的闭包函数了，也就是“终极匹配器”

为什么是while?

前面就提到了，tokenize选择器是可以用过 “,”逗号分组 group,所以就就会有个合集的概念了

matcher就得到了每一个终极匹配器

通过代码很能看出来matcher方法运行的结果都是bool值

对里面的元素逐个使用预先生成的matcher方法做匹配，如果结果为true的则直接将元素堆入返回结果集里面。

matcher

matcher 就是 elementMatcher函数的包装

整个匹配的核心就在这个里面了

        function( elem, context, xml ) {

            var i = matchers.length;

            while ( i-- ) {

                if ( !matchers[i]( elem, context, xml ) ) {

                    return false;

                }

            }

            return true;

        } :

我们先来回顾下这个matchers的组合原理

这个地方是最绕的,也是最晕的,所以还是要深入的理解才行哦

先上个简单的流程图：

画的不好哈哈

执行分解：

第一步:

div > p + div.aaron input[type="checkbox"]

从右边剥离出原生API能使用的接口属性

context.getElementsByTagName( input )

所以找到了input ，因为只可以用 tag是查询，但是此时结果是个合集，引入seed的概念，称之为种子合集

第二步：

div > p + div.aaron [type="checkbox"]'

重组选择器，踢掉input，得到新的tokens词法元素哈希表

第三步：

通过matcherFromTokens函数，然后根据关系选择器【'>',"空","~","+"】拆分分组,因为DOM中的节点都是存在关系的，所以引入

Expr.relative -> first:true 两个关系的“紧密”程度, 用于组合最佳的筛选

一次按照如下顺序解析并且编译闭包函数

编译规则：div > p + div.aaron [type="checkbox"]'
编译成4组闭包函数，然后在前后在合并组合成一组

div >

p +

div.aaron 

input[type="checkbox"]

先看构造一组编译函数

A：抽出div元素，对应的是TAG类型
B：通过Expr.filter找到对应匹配的处理器，返回一个闭包处理器
如：TAG方法

        "TAG": function( nodeNameSelector ) {

            var nodeName = nodeNameSelector.replace( runescape, funescape ).toLowerCase();

            return nodeNameSelector === "*" ?

                function() { return true; } :

                function( elem ) {

                    return elem.nodeName && elem.nodeName.toLowerCase() === nodeName;

                };

        },

C：将返回的curry方法放入到matchers匹配器组中，继续分解

D：抽出子元素选择器 '>' ，对应的类型 type: ">"

E：通过Expr.relative找到elementMatcher方法分组合并多个词素的的编译函数

    function( elem, context, xml ) {

            var i = matchers.length;

            while ( i-- ) {

                if ( !matchers[i]( elem, context, xml ) ) {

                    return false;

                }

            }

所以这里其实就是执行了各自Expr.filter匹配中的的判断方法了,看到这里matcher方法原来运行的结果都是bool值，

所以这里只返回了一个组合闭包，通过这个筛选闭包，各自处理自己内部的元素

F：返回的这个匹配器还是不够的，因为没有规范搜索范围的优先级，所以这时候还要引入addCombinator方法

G：根据Expr.relative -> first:true 两个关系的“紧密”程度
如果是是亲密关系addCombinator返回

function( elem, context, xml ) {

    while ( (elem = elem[ dir ]) ) {

        if ( elem.nodeType === 1 || checkNonElements ) {

            return matcher( elem, context, xml );

        }

    }

}

所以可见如果是紧密关系的位置词素,找到第一个亲密的节点，立马就用终极匹配器判断这个节点是否符合前面的规则

这是第一组终极匹配器的生成流程了

可见过程极其复杂，被包装了三层

依次

addCombinator
elementMatcher
Expr.relative

三个方法嵌套处理出来的结构

然后继续分解下一组，遇到关系选择器又继续依照以上的过程分解

但是有一个不同的地方，下一个分组会把上一个分组给一并合并了

所以整个关系就是一个依赖嵌套很深的结构

最终暴露出来的终极匹配器其实只有一个闭包，但是有内嵌很深的分组闭包了

依照从左边往右依次生成闭包，然后把上一组闭包又push到下一组闭包

就跟栈是一种后进先出的数据结构一样处理了

所以在最外层也就是

type=["checkbox"]

我们回到superMatcher方法的处理了

在遍历seed种子合集，依次匹配matchers闭包函数，传入每一个seed的元素与之匹配（这里就是input），在对应的编译处理器中通过对input的处理，找到最优匹配结果

function( elem, context, xml ) {

    var i = matchers.length;

    while ( i-- ) {

        if ( !matchers[i]( elem, context, xml ) ) {

            return false;

        }

    }

    return true;

} :

这里注意了，是i--，从后往前找
所以第一次开始匹配的就是

check: "checkbox"

name: "type"

operator: "="

那么就找到对应的Attr处理方法

//属性元匹配器工厂

//name ：属性名

//operator ：操作符

//check ： 要检查的值

//例如选择器 [type="checkbox"]中，name="type" operator="=" check="checkbox"

Expr.filter["ATTR"] = function( name, operator, check ) {

  //返回一个元匹配器

  return function( elem ) {

    //先取出节点对应的属性值

    var result = Sizzle.attr( elem, name );

    //看看属性值有木有！

    if ( result == null ) {

      //如果操作符是不等号，返回真，因为当前属性为空 是不等于任何值的

      return operator === "!=";

    }

    //如果没有操作符，那就直接通过规则了

    if ( !operator ) {

      return true;

    }

    //转成字符串

    result += "";

    return

      //如果是等号，判断目标值跟当前属性值相等是否为真

      operator === "=" ? result === check :

      //如果是不等号，判断目标值跟当前属性值不相等是否为真

      operator === "!=" ? result !== check :

      //如果是起始相等，判断目标值是否在当前属性值的头部

      operator === "^=" ? check && result.indexOf( check ) === 0 :

      //这样解释： lang*=en 匹配这样 <html lang="xxxxenxxx">的节点

      operator === "*=" ? check && result.indexOf( check ) > -1 :

      //如果是末尾相等，判断目标值是否在当前属性值的末尾

      operator === "$=" ? check && result.slice( -check.length ) === check :

      //这样解释： lang~=en 匹配这样 <html lang="zh_CN en">的节点

      operator === "~=" ? ( " " + result + " " ).indexOf( check ) > -1 :

      //这样解释： lang=|en 匹配这样 <html lang="en-US">的节点

      operator === "|=" ? result === check || result.slice( 0, check.length + 1 ) === check + "-" :

      //其他情况的操作符号表示不匹配

      false;

  };

},

Sizzle.attr( elem, name )

传入elem元素就是seed中的input元素，找到是否有'type'类型的属性，

比如

<input type="text">"

所以第一次匹配input就出错了，返回的type是text，而不是我们需要的'checkbox'
这里返回的结果就是false，所以整个之后的处理就直接return了

继续拿出第二个input

继续上一个流程，这时候发现检测到的属性

var result = Sizzle.attr( elem, name );

result: "checkbox"

此时满足第一条匹配，然后继续 i = 0

!matchers[i]( elem, context, xml )

找到第0个编译函数

addCombinator

while ( (elem = elem[ dir ]) ) {

    if ( elem.nodeType === 1 || checkNonElements ) {

        outerCache = elem[ expando ] || (elem[ expando ] = {});

        if ( (cache = outerCache[ dir ]) && cache[0] === dirkey ) {

            if ( (data = cache[1]) === true || data === cachedruns ) {

                return data === true;

            }

        } else {

            cache = outerCache[ dir ] = [ dirkey ];

            cache[1] = matcher( elem, context, xml ) || cachedruns;

            if ( cache[1] === true ) {

                return true;

            }

        }

    }

}

如果是不紧密的位置关系

那么一直匹配到true为止

如祖宗关系的话，就一直找父亲节点直到有一个祖先节点符合规则为止

直接递归调用

matcher( elem, context, xml )

其实就是下一组闭包队列了，传入的上下文是 div.aaron，也就是<input type="checkbox"的父节点

function (elem, context, xml) {

                var i = matchers.length;

                //从右到左开始匹配

                while (i--) {

                    //如果有一个没匹配中，那就说明该节点elem不符合规则

                    if (!matchers[i](elem, context, xml)) {

                        return false;

                    }

                }

                return true;

        }

依照上面的规则，这样递归下去了，一层一层的匹配

可见它原来不是一层一层往下查，却有点倒回去向上做匹配、过滤的意思。Expr里面只有find和preFilter返回的是集合。

尽管到这里暂时还带着一点疑问，就是最后它为什么用的是逐个匹配、过滤的方法来得到结果集，但是我想Sizzle最基本的“编译原理”应该已经解释清楚了。

哥们，别光看不顶啊！

jQuery 2.0.3 源码分析Sizzle引擎 - 超级匹配的更多相关文章

jQuery 2.0.3 源码分析Sizzle引擎解析原理
jQuery 2.0.3 源码分析Sizzle引擎 - 解析原理声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 先来回答博友的提问: 如何解析 div > p + ...
jQuery 2.0.3 源码分析Sizzle引擎 - 词法解析
声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 浏览器从下载文档到显示页面的过程是个复杂的过程,这里包含了重绘和重排.各家浏览器引擎的工作原理略有差别,但也有一定规则. 简 ...
jQuery 2.0.3 源码分析Sizzle引擎 - 解析原理
声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 先来回答博友的提问: 如何解析 div > p + div.aaron input[type="checkb ...
jQuery 2.0.3 源码分析Sizzle引擎 - 编译函数（大篇幅）
声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 从Sizzle1.8开始,这是Sizzle的分界线了,引入了编译函数机制网上基本没有资料细说这个东东的,sizzle引入这 ...
jQuery 2.0.3 源码分析Sizzle引擎 - 高效查询
为什么Sizzle很高效? 首先,从处理流程上理解,它总是先使用最高效的原生方法来做处理 HTML文档一共有这么四个API: getElementById 上下文只能是HTML文档浏览器支持情况:I ...
jQuery 2.0.3 源码分析 Deferred（最细的实现剖析，带图）
Deferred的概念请看第一篇 http://www.cnblogs.com/aaronjs/p/3348569.html ******************构建Deferred对象时候的流程图* ...
jQuery 2.0.3 源码分析core - 选择器
声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 打开jQuery源码,一眼看去到处都充斥着正则表达式,jQuery框架的基础就是查询了,查询文档元素对象 ...
jQuery 2.0.3 源码分析 Deferred概念
JavaScript编程几乎总是伴随着异步操作,传统的异步操作会在操作完成之后,使用回调函数传回结果,而回调函数中则包含了后续的工作.这也是造成异步编程困难的主要原因:我们一直习惯于“线性”地编写代码 ...
jQuery 2.0.3 源码分析事件绑定 - bind/live/delegate/on
事件(Event)是JavaScript应用跳动的心脏,通过使用JavaScript ,你可以监听特定事件的发生,并规定让某些事件发生以对这些事件做出响应事件的基础就不重复讲解了,本来是定位源码分析 ...

随机推荐

【原】iOS学习之tableView的常见BUG
1.TableView头视图不随视图移动,头视图出现错位错误原因:tableView的 UITableViewStyle 没有明确的声明解决方法:在tableView声明的时候明确为 UITabl ...
swift-func（函数）
函数是一个组织在一起语句集合,以执行特定任务. Swift 函数类似于简单 C 函数以及复杂的 Objective C 语言函数. 它使我们能够通过函数调用内部的局部和全局参数值. 像其他任何语言一样 ...
分布式数据库的四分结构设计 BCDE
首先,对关系型数据库的表进行四种分类定义: Basis 根基,Content 内容, Description 说明, Extension 扩展. Basis:Baisis 表是唯一的,为了实现标准而得 ...
linu for循环
用途说明在shell中用于循环.类似于其他编程语言中的for,但又有些不同.for循环是Bash中最常用的语法结构. 常用格式格式一 for 变量 do 语句 done 格式二 for 变量 in ...
windows service 1053错误启动失败
做项目移植的时候发现一个项目的window service启动失败,最后试出来是启动时间超时解决办法是给window service设置一个长一点的等待时间,步骤如下: 启动,输入regedit启动 ...
Hibernate criteria 增加排序项
AngularJS：自定义过滤器
表达式: {{ expression | filter1 | filter2 | ... }} {{ expression | filterName : paramet ...
Jenkins部署配置简介
前段时间研究了一下自动化测试,因而接触到了Jenkins,今天有时间进行一下Jenkins部署配置相关知识的总结分享前言:由于本次只是实验性研究,采用Windows环境,因此Jenkins可以通过下 ...
Ionic实战自动升级APP(Android版)
Ionic 框架介绍 Ionic是一个基于Angularjs.可以使用HTML5构建混合移动应用的用户界面框架,它自称为是"本地与HTML5的结合".该框架提供了很多基本的移动用户 ...
执行mysqld_safe报错:mysqld does not exist or is not executable
执行mysqld_safe报错: [root@edu data]# /usr/local/mysql5.7/bin/mysqld_safe --user=mysql160427 12:41:28 my ...

jQuery 2.0.3 源码分析Sizzle引擎 - 超级匹配

jQuery 2.0.3 源码分析Sizzle引擎 - 超级匹配的更多相关文章

随机推荐

热门专题