Atitit..状态机与词法分析通用分词器分词引擎的设计与实现 attilax总结

1. 状态机理论参考

Atitit. 有限状态机 fsm 状态模式 - attilax的专栏 - 博客频道 - CSDN.NET.htm

2. 词法分析理论

atitit.词法分析的实现token attilax总结 - attilax的专栏 - 博客频道 - CSDN.NET.htm

atitit.自己动手开发编译器and解释器(1) ------词法分析--attilax总结 - attilax的专栏 - 博客频道 - CSDN.NET.htm

作者:: 老哇的爪子 Attilax 艾龙， EMAIL:1466519819@qq.com

转载请注明来源： http://www.cnblogs.com/attilax/

3. 词法分析实例

atitit..sql update语法的词法分析，与语法ast构建 - attilax的专栏 - 博客频道 - CSDN.NET.htm

atitit.java解析sql语言解析器解释器的实现 - 其他综合 - 红黑联盟.htm

4. ---code fsm 状态机通用实现

package com.attilax.fsm;

import java.util.ArrayList;

import java.util.List;

import com.attilax.lang.text.strUtil;

4.1. Context

public class Context {

public State state;

public List<Token> tokenList=new ArrayList <Token>();

public Token curToken=new Token();

public int curcharIndex;

public char[] sa;

public State getState() {

return state;

}

public void setState(State state) {

this.state = state;

}

public void request(String s) {

if(sa==null)

sa=s.toCharArray();

state.handle(s, this);

}

package com.attilax.fsm;

import java.util.List;

import com.attilax.fsm.camelScanner.iniState;

package com.attilax.fsm;

4.2. public abstract class State {

public static void main(String[] args) {

// TODO Auto-generated method stub

}

public boolean MoveNextisEnd(Context context) {

context.curcharIndex++;

if(context.curcharIndex>=context.sa.length)

{

addCurToken(context );

context.state=new FinishState();

return true;

}

return false;

}

public void addCurToken(Context context) {

context.tokenList.add(context.curToken);

}

public void newToken(Context context , char curChar) {

Token token = new Token();

token.value= token.value+String.valueOf(curChar);

context.curToken=token;

}

public void addCurTokenNnewToken(Context context, char curChar) {

addCurToken(context);

newToken(context,curChar);

}

public abstract void handle(String sampleParameter, Context context) ;

}

package com.attilax.fsm;

4.3. public class Token {

public String value="";

public String getValue() {

return value;

}

public void setValue(String value) {

this.value = value;

}

package com.attilax.fsm;

4.4. public class FinishState extends State {

@Override

public void handle(String sampleParameter, Context context) {

// TODO Auto-generated method stub

}

5. 扫描器

5.1. public class Scanner {

public static void main(String[] args) {

// TODO Auto-generated method stub

Strings = "fld1=1,fld2='at''t,lax',fld3='val3'";

s="aaaaCamelJSONObject123forMac";

}

public List getTokenList(String s) {

// DslPaserContext context = new DslPaserContext();

Context context = new Context ();

context.setState(new iniState());

int n = 0;

while (!(context.state instanceof FinishState)) {

// System.out.println(n);

// ��

context.request(s);

n++;

if (n > 200)

break;

}

for (Token tk : context.tokenList) {

// if(tk.value.trim().length()>0)

System.out.println(tk.value + "===");

}

return (List) context.tokenList;

}

public List<String> getTokenList_retStr(String s)

{

if(s.length()==0)

return new ArrayList<String>();

List<String> li_r=new ArrayList<String>();

List<Token> li=getTokenList(s);

for (Token token : li) {

li_r.add(token.value);

}

return li_r;

}

Atitit..状态机与词法分析通用分词器分词引擎的设计与实现 attilax总结的更多相关文章

Atitit. camel分词器分词引擎 camel拆分的实现设计
Atitit. camel分词器分词引擎 camel拆分的实现设计 1. camel分词器1 1.1. 实现的界定符号大写字母小写字母数字1 1.2. 特殊处理对于JSONObject 多个大写 ...
IKanalyzer分词器分词并且统计词频
<dependency> <groupId>com.janeluo</groupId> <artifactId>ikanalyzer</artif ...
ElasticSearch最全分词器比较及使用方法
介绍:ElasticSearch 是一个基于 Lucene 的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口.Elasticsearch 是用 Java 开 ...
Apache Lucene(全文检索引擎)—分词器
目录返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 本项目Demo已上传GitHub,欢迎大家fork下载学习:https://gith ...
2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
Lucene第二篇【抽取工具类、索引库优化、分词器、高亮、摘要、排序、多条件搜索】
对Lucene代码优化我们再次看回我们上一篇快速入门写过的代码,我来截取一些有代表性的: 以下代码在把数据填充到索引库,和从索引库查询数据的时候,都出现了.是重复代码! Directory dire ...
Lucene.net(4.8.0) 学习问题记录五: JIEba分词和Lucene的结合，以及对分词器的思考
前言:目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作,不过自己是把别人做好的项目进行迁移.因为项目整体要迁移到ASP.NET Core 2.0版本,而Lucene使用的版本是3 ...
Elasticsearch之分词器的作用
前提什么是倒排索引? Analyzer(分词器)的作用是把一段文本中的词按一定规则进行切分.对应的是Analyzer类,这是一个抽象类,切分词的具体规则是由子类实现的,所以对于不同的语言,要用不同的 ...
Elastic Search中normalization和分词器
为key_words提供更加完整的倒排索引. 如:时态转化(like | liked),单复数转化(man | men),全写简写(china | cn),同义词(small | little)等. ...

随机推荐

[Codeforces 35E] Parade
Link: Codeforces 35E 传送门 Brief Intro: 给定$n$个矩形,求出轮廓线的所有顶点 Solution: 对于此类可拆分成多个事件点的题目,使用扫描线的方式将每个矩形分 ...
POJ 2348 Euclid's Game（博弈论）
[题目链接] http://poj.org/problem?id=2348 [题目大意] 给出两个数,两个参赛者轮流用一个数减去另一个数的倍数,当一个数为0的时候游戏获胜, 求先手是否必胜 [题解] ...
[51nod1538]一道难题
先观察一下题目给出的式子:对所有满足$\begin{align*}\sum\limits_{i=1}^na_ib_i=m\end{align*}$的$b_{1\cdots n}$,计算$\begin{ ...
【Java】Java划水练习
bzoj1000 A+B Problem Scanner sc=new Scanner(new BufferedInputStream(System.in)); 声明读入器 nextInt 读入整数 ...
【后缀数组】poj3581 Sequence
考虑第一次切割,必然切割的是翻转后字典序最小的前缀,伪证: 若切割位置更靠前:则会导致第一个数翻转后更靠前,字典序必然更大. 若切割位置更靠后,则显然也会导致字典序更大. ↑,sa即可对于第二次切割 ...
倒置输入的数 Exercise07_02
import java.util.Scanner; /** * @author 冰樱梦 * 时间:2018年下半年 * 题目:倒置输入的数 * */ public class Exercise07_0 ...
Mybatis更新用户
xml配置  <update id="updateUserById" parameterType="com.itheima.my ...
Jackson错误：Can not deserialize instance of java.lang.String out of START_OBJECT token
org.springframework.http.converter.HttpMessageNotReadableException: Could not read JSON: Can not des ...
Jmeter调用Webapi介绍
一.介绍 JMeter主要用于压力测试,使用Java编写,由Apache基金会管理官方网站:http://jmeter.apache.org/index.html 下载地址: ...
Xcode编译错误和警告汇总
1.error: macro names must be identifiers YourProject_prefix.pch 原因: 因为你弄脏了预处理器宏,在它处于<Multiple Val ...

Atitit..状态机与词法分析 通用分词器 分词引擎的设计与实现 attilax总结

1. 状态机 理论参考

2. 词法分析理论

3. 词法分析实例

4. ---code fsm 状态机通用实现

4.1. Context

4.2. public abstract class State {

4.3. public class Token {

4.4. public class FinishState extends State {

5. 扫描器

5.1. public class Scanner {

Atitit..状态机与词法分析 通用分词器 分词引擎的设计与实现 attilax总结的更多相关文章

随机推荐

热门专题

Atitit..状态机与词法分析通用分词器分词引擎的设计与实现 attilax总结

1. 状态机理论参考

Atitit..状态机与词法分析通用分词器分词引擎的设计与实现 attilax总结的更多相关文章