复杂的动态布尔表达式性能评估(1)--Antlr4实现

前言:
　　规则引擎中, 往往涉及到多个条件构成了复杂布尔表达式的计算. 对于这类布尔表达式, 一是动态可变的(取决于运营人员的设定), 二是其表达式往往很复杂. 如何快速的计算其表达式的值, 该系列文章将以两种方式, Antlr4动态生成AST(抽象语法树), 以及Groovy动态编译的方式来对比评估, 看看哪种方式性能更优, 以及各自的优缺点. 本篇文章将侧重于介绍Antlr4的实现思路.

模型简化:
　　每个规则可以理解为多个条件构建的复杂布尔表达式, 而条件本身涉及不同的变量和阈值(常量), 以及中间的操作符(>=, >, <, <=, !=, =).
　　比如某个具体的规则:

rule = expr1 && (expr2 || expr3) || expr4

　　而其具体条件expr1/expr2/expr3/expr4如下:

expr1 => var1 >=

expr2 => var2 !=

expr3 => var3 < 3.0

expr4 => var4 = true

　　为了简化评估, 我们简单设定每个条件就是一个布尔变量(bool). 这样每个规则rule就可以理解为多个布尔变量, 通过&&和||组合的表达式了, 简单描述为:

rule = 1 && (2 || 3) || 4

　　数字N(1,2,...)为具体的布尔变量, 类似这样的简化模型, 方便性能评估.

Antlr4构建:
　　Anltr4是基于LL(K), 以递归下降的方式进行工作. 它能自动完成语法分析和词法分析过程，并生产框架代码.
　　具体可参阅文章: 利用ANTLR4实现一个简单的四则运算计算器, 作为案列参考.
　　其实表达式解析比四则混合运算的语法gammar还要简单.
　　编写EasyDSL.g4文件:

grammar EasyDSL;

/** PARSER */

line : expr EOF ;

expr

    : '(' expr ')'          # parenExpr

    | expr '&&' expr          # andEpr

    | expr '||' expr          # orEpr

    | ID                    # identifier

;

/** LEXER */

WS : [ \t\n\r]+ -> skip ;

ID : DIGIT+ ;

fragment DIGIT : '0'..'9';

　　其在idea工程中, 如下所示:
　　
　　配置pom.xml, 添加dependency和plugin.

    <dependencies>

        <dependency>

            <groupId>org.antlr</groupId>

            <artifactId>antlr4-runtime</artifactId>

            <version>4.3</version>

        </dependency>

    </dependencies>

    <plugins>

    	<build>

            <plugin>

                <groupId>org.antlr</groupId>

                <artifactId>antlr4-maven-plugin</artifactId>

                <version>4.3</version>

                <executions>

                    <execution>

                        <id>antlr</id>

                        <goals>

                            <goal>antlr4</goal>

                        </goals>

                        <!--<phase>none</phase>-->

                    </execution>

                </executions>

                <configuration>

                    <outputDirectory>src/main/java</outputDirectory>

                    <listener>true</listener>

                    <treatWarningsAsErrors>true</treatWarningsAsErrors>

                </configuration>

            </plugin>

        </plugins>

    </build>

　　具体执行命令

mvn antlr4:antlr4

　　则生成对应的代码
　　

代码扩展:
　　Antlr4帮我们构建了基础的词法和语法解析后, 后续工作需要我们自己做些功能扩展.
　　首先我们定义操作枚举类:

package com.dsl.perfs;

public enum ExprType {

    AND,

    OR,

    ID;

}

　　然后是具体的节点类:

package com.dsl.perfs;

public class ExprNode {

    public ExprType type;

    public String id;

    public ExprNode left;

    public ExprNode right;

    public ExprNode(ExprType type, String id, ExprNode left, ExprNode right) {

        this.type = type;

        this.id = id;

        this.left = left;

        this.right = right;

    }

}

　　最后重载Listener类, 对这可抽象语法树进行构建.

package com.dsl.perfs;

import com.dsl.ast.EasyDSLBaseListener;

import com.dsl.ast.EasyDSLParser;

import org.antlr.v4.runtime.misc.NotNull;

import java.util.Stack;

public class EasyDSLListener extends EasyDSLBaseListener {

    private Stack<ExprNode> stacks = new Stack<>();

    @Override

    public void exitIdentifier(@NotNull EasyDSLParser.IdentifierContext ctx) {

        stacks.push(new ExprNode(ExprType.ID, ctx.getText(), null, null));

    }

    @Override

    public void exitAndEpr(@NotNull EasyDSLParser.AndEprContext ctx) {

        ExprNode right = stacks.pop();

        ExprNode left = stacks.pop();

        stacks.push(new ExprNode(ExprType.AND, null, left, right));

    }

    @Override

    public void exitOrEpr(@NotNull EasyDSLParser.OrEprContext ctx) {

        ExprNode right = stacks.pop();

        ExprNode left = stacks.pop();

        stacks.push(new ExprNode(ExprType.OR, null, left, right));

    }

    @Override

    public void exitLine(@NotNull EasyDSLParser.LineContext ctx) {

        super.exitLine(ctx);

    }

    @Override

    public void exitParenExpr(@NotNull EasyDSLParser.ParenExprContext ctx) {

        // DO NOTHING

    }

    public ExprNode getResult() {

        return stacks.peek();

    }

}

　　以下是工具类, 其具体构建AST, 并进行具体的值评估.

package com.dsl.perfs;

import com.dsl.ast.EasyDSLLexer;

import com.dsl.ast.EasyDSLParser;

import org.antlr.v4.runtime.ANTLRInputStream;

import org.antlr.v4.runtime.CommonTokenStream;

import java.util.Map;

import java.util.concurrent.ConcurrentHashMap;

public class ExprEvalutorHelper {

    private static ConcurrentHashMap<String, ExprNode> exprAstClassMap = new ConcurrentHashMap();

    public static boolean exec(String expr, Map<String, Boolean> params) {

        ExprNode root = exprAstClassMap.get(expr);

        if ( root == null ) {

            synchronized (expr.intern()) {

                if ( root == null ) {

                    EasyDSLLexer lexer = new EasyDSLLexer(new ANTLRInputStream(expr));

                    /* 根据lexer 创建token stream */

                    CommonTokenStream tokens = new CommonTokenStream(lexer);

                    /* 根据token stream 创建 parser */

                    EasyDSLParser paser = new EasyDSLParser(tokens);

                    /* 为parser添加一个监听器 */

                    EasyDSLListener listener = new EasyDSLListener();

                    paser.addParseListener(listener);

                    /* 匹配 line, 监听器会记录结果 */

                    paser.line();

                    root = listener.getResult();

                    exprAstClassMap.put(expr, root);

                }

            }

        }

        return ExprEvalutorHelper.evalute(root, params);

    }

    public static boolean evalute(ExprNode cur, Map<String, Boolean> params) {

        if ( cur.type == ExprType.ID ) {

            return params.get(cur.id);

        } else {

            if ( cur.type == ExprType.AND ) {

                boolean leftRes = evalute(cur.left, params);

                // *) 剪枝优化

                if ( leftRes == false ) return false;

                boolean rightRes = evalute(cur.right, params);

                return leftRes && rightRes;

            } else {

                // *) 如果为 OR

                boolean leftRes = evalute(cur.left, params);

                // *) 剪枝优化

                if ( leftRes == true ) return true;

                boolean rightRes = evalute(cur.right, params);

                return leftRes || rightRes;

            }

        }

    }

}

　　以表达式

 &&  ||  ||  && ( || )

　　为例, 其最后最后的AST树如下所示:
　　

测试评估:
　　编写如下测试代码, 来进行性能评估:

package com.dsl.comp;

import com.dsl.perfs.ExprEvalutorHelper;

import java.util.Map;

import java.util.Random;

import java.util.TreeMap;

public class AntlrPerf {

    public static void main(String[] args) {

        String boolExpr = "1 && 2 || 3 || 4 && (5 || 6)";

        int iterNums = 1000000;

        long randomSeed = 10001L;

        Random random = new Random(randomSeed);

        Long beg = System.currentTimeMillis();

        for ( int i = 0; i<=iterNums; i++ ) {

            Map<String, Boolean> params = new TreeMap<>();

            params.put("1", random.nextBoolean());

            params.put("2", random.nextBoolean());

            params.put("3", random.nextBoolean());

            params.put("4", random.nextBoolean());

            params.put("5", random.nextBoolean());

            params.put("6", random.nextBoolean());

            ExprEvalutorHelper.exec(boolExpr, params);

        }

        long end = System.currentTimeMillis();

        System.out.println(String.format("total consume: %dms", end - beg));

    }

}

　　测试结果如下:

total consume: 755ms

　　100万次计算, 累计消耗755ms, 似乎不错. 但是具体的性能好坏, 需要对比, 下篇将使用Groovy方式去实现, 并进行对比.

总结:
　　文章介绍了Antlr去解析评估复杂布尔表达式的思路, 其性能也相当的客观, 下文将介绍Groovy的方式去评估, 看看两者性能差异, 以及优缺点.

复杂的动态布尔表达式性能评估(1)--Antlr4实现的更多相关文章

复杂的动态布尔表达式性能评估(2)--Groovy实现
前言: 规则引擎中, 往往涉及到多个条件构成了复杂布尔表达式的计算. 对于这类布尔表达式, 一是动态可变的(取决于运营人员的设定), 二是其表达式往往很复杂. 如何快速的计算其表达式的值, 该系列文章 ...
[转载]Linux服务器性能评估与优化
转载自:Linux服务器性能评估与优化一.影响Linux服务器性能的因素 1. 操作系统级 CPU 内存磁盘I/O带宽网络I/O带宽 2. 程序应用级二.系统性能评估标准影响性 ...
Linux服务器性能评估
一.影响Linux服务器性能的因素 1. 操作系统级 CPU 内存磁盘I/O带宽网络I/O带宽 2. 程序应用级二.系统性能评估标准影响性能因素影响性能因素评判标准好坏糟糕 CPU ...
Linux服务器性能评估与优化--转
http://www.itlearner.com/article/4553 一.影响Linux服务器性能的因素 1. 操作系统级 Ø CPU Ø 内存 Ø 磁盘I/ ...
Linux服务器性能评估与优化(一)
网络内容总结(感谢原创) 1.前言简介一.影响Linux服务器性能的因素 1. 操作系统级性能调优是找出系统瓶颈并消除这些瓶颈的过程. 很多系统管理员认为性能调优仅仅是调整一下 ...
[转]网络性能评估工具Iperf详解（可测丢包率）
原文链接:安全运维之:网络性能评估工具Iperf详解:http://os.51cto.com/art/201410/454889.htm 参考博文:http://linoxide.com/monito ...
转贴---Linux服务器性能评估
http://fuliang.iteye.com/blog/1024360 http://unixhelp.ed.ac.uk/CGI/man-cgi?vmstat ------------------ ...
目标检测模型的性能评估--MAP（Mean Average Precision）
目标检测模型中性能评估的几个重要参数有精确度,精确度和召回率.本文中我们将讨论一个常用的度量指标:均值平均精度,即MAP. 在二元分类中,精确度和召回率是一个简单直观的统计量,但是在目标检测中有所不同 ...
Linux性能评估命令
Linux性能评估工具 https://www.cnblogs.com/dianel/p/10085454.html Linux性能评估工具目录介绍负载:uptime 查看内核的信息: dmes ...

随机推荐

GIS入门基础知识点
自从国企辞职以后,找了一份关于GIS开发的工作,好多从事这个都是地理信息科学方面的专业.由于自己才疏学浅,只能从头入门学起,先是大致了解公司的业务以及产品,学习一下相关地理信息的基础知识. 首先今天简 ...
pycham相关+Python基础
pycham 1.设置pycham和线上服务器同步代码 a.Tools--->Deployment--->Configuration b.设置连接的服务器IP c.设置连接的用户名+密 ...
vue-navigation 实现前进刷新，后退不刷新
vue-navigation GitHub地址导航默认行为类似手机APP的页面导航(A.B.C为页面): A前进到B,再前进到C: C返回到B时,B会从缓存中恢复: B再次前进到C,C会重新生成,不 ...
从此web开发so easy!
ECharts (Enterprise Charts 商业产品图表库) 基于Canvas,纯Javascript图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表.创新的拖拽重计算.数据视图 ...
python3+ftplib实现ftp客户端
一.程序说明 1.1 程序实现关键点 python实现ftp客户端,主要会遇到以下四个问题: 第一个问题是使用什么包实现----我们这里是使用标准库中的ftplib 第二个问题是怎么连接登录ftp服务 ...
Java ip地址查询,根据ip接口获得ip所在省市区,邮编,运营商等
早上一来,项目经理就说需要添加一个用户ip归属地查询功能,然后在网上搜罗半天,研究出一个比较简单的方法,通过接口返回地址json数据有百度接口,新浪接口,这里用的是淘宝ip接口通过淘宝IP地址库获 ...
am335x system upgrade uboot sd boot(一)
由于上层应用的需求,需要运行arm docker,在kernel3.2上面还不支持,且编译器的glibc版本比较低的问题,故需要做系统升级新的内核4.14.40驱动开发和以往有很大的不同,关键在于d ...
bzoj3277
题解: 后缀自动机然后抄了一发题解可以看看这个博客:http://blog.csdn.net/clover_hxy/article/details/53861268 代码: #include< ...
day18-python的正则表达式
1. 正则表达式基础 1.1. 简单介绍正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十 ...
vue-11-自定义指令
用于对纯 DOM 元素进行底层操作. // 注册一个全局自定义指令 v-focus Vue.directive('focus', { // 当绑定元素插入到 DOM 中. inserted: func ...

复杂的动态布尔表达式性能评估(1)--Antlr4实现

复杂的动态布尔表达式性能评估(1)--Antlr4实现的更多相关文章

随机推荐

热门专题