sizzle分析记录：词法分析器(tokenize)

词法分析器(tokenize)？

词法分析器又称扫描器。词法分析是指将我们编写的文本代码流解析为一个一个的记号，分析得到的记号以供后续语法分析使用。

sizzle引入了tokenize这个概念，意义?

jQuery的选择器，实现了css1-css3的API，但是ECMAScript低版本的API中本身没有针对这种CSS的处理API，在IE8以上就引入了querySelectorAll

各种浏览器实现还有差异，这里不是主题，我们看如果是低版本的接口要如果处理复杂的CSS选择器

首先面临的就是要对复杂的选择器进行分解

例如：

div > div.Aaron p span.red

只能针对每个版本的浏览器的支持力度去匹配各自的选择

所以此时会引入一个词法分析器(tokenize)用来把用户复杂的匹配选择，分解成各自的单元，可以提供给后面对应的接口处理

选择器总的来说分四大类：

并联就是合并分组，用逗号分隔

简单的选择器，ID，TAG，CLASS，ATTR，*

关系选择器：> ,+ , ~, 空格

伪类：动作伪类，目标伪类，语言伪类，状态伪类，结构伪类，取反伪类

Sizzle的Token格式如下：

{

   value:'匹配到的字符串',

   type:'对应的Token类型',

   matches:'正则匹配到的一个结构'

}

tokenize需要解析的几种情况：

情况一：多重选择器分组

soFar ：$("div, span, p.myClass" )

在出现逗号分隔符的时候，就说明选择所有指定的选择器的组合结果，所以需要分割成各自的处理模块

这种事情当然交给正则来干是最合适的

常规的思路先是通过split(,)先把选择器劈成三部分，然后依次处理各自的模块

jQuery对于过滤正则都有一个特点，就是都是元字符^开头，开限制匹配的初始，所以tokenize也是从左边开始一层一层的剥离

rcomma.exec( soFar )) 

var whitespace = "[\\x20\\t\\r\\n\\f]";

var rcomma = new RegExp( "^" + whitespace + "*," + whitespace + "*" )

匹配第一个出现的非显示字符

换句话匹配

, span, p.myClass

然后在划分容器

if ( !matched || (match = rcomma.exec( soFar )) ) {

    if ( match ) {

        // Don't consume trailing commas as valid

        soFar = soFar.slice( match[0].length ) || soFar;

    }

    groups.push( (tokens = []) );

}

其结果就是：（结构不合理，先理解这个意思）

groups:[

      tokens ：{div, span},

      tokens ：{p.myClass}

]

情况二：关系处理器分组

在层级关系中有几种特殊的划分 Token ： >, +, 空格, ~ 用来表明父与子，兄弟，祖辈子孙之间的层级关系

$( "ul.topnav > li" )

从 > 划分

rcombinators = new RegExp( "^" + whitespace + "*([>+~]|" + whitespace + ")" + whitespace + "*" ),

可以是>+~或者空白

这个分组是为了之后的关系选择确定

if ( (match = rcombinators.exec( soFar )) ) {

    matched = match.shift();

    tokens.push({

        value: matched,

        // Cast descendant combinators to space

        type: match[0].replace( rtrim, " " )

    });

    soFar = soFar.slice( matched.length );

}

剩余几种Token ：

Expr.filter ：TAG, ID, CLASS, ATTR, CHILD, PSEUDO

通过一系列的正则抽出表达式中的内容

ID:

///^#((?:\\.|[\w-] | [^\x00-\xa0] ) +)/

var characterEncoding = "(?:\\\\.|[\\w-]|[^\\x00-\\xa0])+";

var ID = new RegExp("^#(" + characterEncoding + ")")

console.log(ID.exec("#div > li"))  //["#div", "div", index: 0, input: "#div > li"]

TAG：

var TAG =  new RegExp( "^(" + characterEncoding.replace( "w", "w*" ) + ")" );

console.log(TAG.exec("li > sadf.da dsf"))  //["#div", "div", index: 0, input: "#div > li"]

CLASS:

var Class = new RegExp( "^\\.(" + characterEncoding + ")" );

console.log(Class.exec(".li > sadf.da dsf"))

ATTR：

属性选择器有点复杂，通过第一次正则只能匹配器出整体，所以需要第二次分解，引入了Expr.preFilter

Expr.preFilter保留了3个兼容处理分别是ATTR，CHILD，PSEUDO复杂的选择器

var identifier = characterEncoding.replace( "w", "w#" );

var attributes = "\\[" + whitespace + "*(" + characterEncoding + ")(?:" + whitespace +

    // Operator (capture 2)

    "*([*^$|!~]?=)" + whitespace +

    // "Attribute values must be CSS identifiers [capture 5] or strings [capture 3 or capture 4]"

    "*(?:'((?:\\\\.|[^\\\\'])*)'|\"((?:\\\\.|[^\\\\\"])*)\"|(" + identifier + "))|)" + whitespace +

    "*\\]";

var ATTR = new RegExp( "^" + attributes );

console.log(ATTR.exec("[name*='man']")

preFilter:

preFilter: {

    "ATTR": function( match ) {

        match[1] = match[1].replace( runescape, funescape );

        // Move the given value to match[3] whether quoted or unquoted

        match[3] = ( match[3] || match[4] || match[5] || "" ).replace( runescape, funescape );

        if ( match[2] === "~=" ) {

            match[3] = " " + match[3] + " ";

        }

        return match.slice( 0, 4 );

    },

伪类放下一章

sizzle分析记录：词法分析器(tokenize)的更多相关文章

sizzle分析记录：关于querySelectorAll兼容问题
querySelector和querySelectorAll是W3C提供的新的查询接口目前几乎主流浏览器均支持了他们.包括 IE8(含) 以上版本. Firefox. Chrome.Safari.O ...
sizzle分析记录：分解流程
<form> <label>Name:</label> <input name="name" /> <fieldset> ...
sizzle分析记录：getAttribute和getAttributeNode
部分IE游览器下无法通过getAttribute取值? <form name="aaron"> <input type="text" name ...
sizzle分析记录：属性选择器
源码部分通过Sizzle.attr匹配出值然后通过表达式刷选计算 "ATTR": function( name, operator, check ) { return func ...
sizzle分析记录: 自定义伪类选择器
可见性 :hidden :visible 隐藏对象没有宽高,前提是用display:none处理的 jQuery.expr.filters.hidden = function( elem ) { // ...
Fine报表权限流程分析记录
Fine报表权限流程分析记录 URL访问三种类型的报表:第一个:BI报表例如: http://192.25.103.250:37799/WebReport/ReportServer?op=fr_bi ...
PostgreSQL的基础数据类型分析记录-转
src:http://www.codeweblog.com/postgresql%E7%9A%84%E5%9F%BA%E7%A1%80%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E ...
获取登录验证码失败及前后端不同域导致session丢失问题分析记录
前言前两周在把兄弟公司的几个服务部署到我们公司测试环境服务器的时候又遇到了不少问题,因为是前后端分离的项目,所以这次也同样遇到了跨域问题,解决方式也跟上一回的不一样,这里就再来分析记录一下. 登录验 ...
Java GC分析记录
Java GC记录近来.项目没有特别忙碌的时候,抽空看了下生产环境的项目运行状况,我们的项目一直运行速度不是很快,偶尔会出现卡顿的现象,这点给人的体验感觉也就不那么好了.先抛个测试环境截图(生产环境 ...

随机推荐

block 从B界面向A界面传值
最近在改公司外包项目的代码,发现了一种block传值的用法很有意思,记录一下 A.B两个页面在B界面.h中定义 @property (nonatomic,strong) void(^block)(N ...
cocos2dx 实现flappybird
前两天在博客园看到网友实现的一个网页版的flappy bird,挂在360游戏平台,玩了一会儿得分超低,就很想自己做一个.刚好这两天炫舞的活都清了,就弄一下玩玩. 效果图布局类GameScene.h ...
java并发编程（十三）经典问题生产者消费者问题
生产者消费者问题是线程模型中的经典问题:生产者和消费者在同一时间段内共用同一存储空间,生产者向空间里生产数据,而消费者取走数据. 这里实现如下情况的生产--消费模型: 生产者不断交替地生产两组数据&q ...
mui框架中底部导航的跳转1
mui框架极大的方便了app的开发但是我们在做页面之间的切换时发现不能实现 a 链接的跳转,这是应为mui相关的一些控件是通过拦截a标签上的href来实现的,所以mui.js会阻止a标签上的href跳 ...
温故而知新 css + html 超级牛逼的居中策略
该方法甚至可以解决img内容居中的问题套路:最外层div宽度为居中内容所占的宽度(通常是1170px),并且使其居中(margin:auto) 里层的div宽度为全屏(通常是1920px;)再mar ...
Unity3D 物体跟随鼠标旋转
float speed=1000f; void Update () { if (Input.GetMouseButton (0)) { transform.Rotate (0,-Input.GetAx ...
Powershell 十个常见任务
学习Powershell的时候,基本的语法也了解了一些,但是就是不知道要写些什么?作为一个过来者,和大家一起分享下常见的几个管理任务脚本. 1.更改本地Administrator账号密码 [ADSI] ...
Amoeba -- 阿里巴巴工程师的开源项目之一陈思儒
http://www.kuqin.com/opensource/20081023/24026.html 个人博客 http://dbanotes.net/web/page/44 阿里巴巴分布式服务框架 ...
FMX保存JPG格式的Stream
刚刚看以前的笔记,估计这个用的人很少 var surf:TBitmapSurface; astream:TmemoryStream; begin surf:=TbitmapSurface.Create ...
AWS 免费套餐
AWS 免费套餐转载自:https://aws.amazon.com/cn/free/?sc_channel=PS&sc_campaign=acquisition_CN&sc_pub ...

sizzle分析记录：词法分析器(tokenize)

sizzle分析记录：词法分析器(tokenize)的更多相关文章

随机推荐

热门专题