flex词法解析
例子1、从标准输入的字数、单词、行数统计
%{
#include <string.h>
int chars = 0;
int lines = 0;
int words = 0;
%}
%%
[a-zA-Z]+ { chars += strlen(yytext); words++; }
\n { lines++; }
. { chars++; }
%%
int main(int argc, char** argv)
{
yylex();
printf("chars=%d,words=%d,lines=%d\n",chars,words,lines);
return 0;
}
对应的Makefile文件:
test:wc.l
flex wc.l
gcc -W -o test lex.yy.c
clean:
rm -rf test lex.yy.o
出现错误信息:
[root@typhoeus79 flex]# make
flex wc.l
gcc -W -o test lex.yy.c
/tmp/ccSylYmr.o: In function `yylex':
lex.yy.c:(.text+0x413): undefined reference to `yywrap'
/tmp/ccSylYmr.o: In function `input':
lex.yy.c:(.text+0xcb8): undefined reference to `yywrap'
collect2: ld returned 1 exit status
make: *** [test] Error 1
解决方案1:添加设置noyywrap设置 ,
%option noyywrap
解决方案2:设置绑定flex对应的库:
gcc -W -o test lex.yy.c -lfl
例子2、从一个文件中读取分析的内容,按照字母组成、数字、空格以及换行符进行区分
[root@typhoeus79 wc]# more test.l
/*默认是从标准输入输出读取,设置该选项支持从文件读取*/
%option noyywrap
%{
%} %% [a-zA-Z]+ { printf("CHAR Match=%s\n",yytext);}
\n { printf("Enter Match=%s\n",yytext);}
[0-9]+ { printf("Digitals Match=%s\n",yytext); }
[ \t]* { printf("SPACE Match=%s\n",yytext); } %% main(int argc,char ** argv)
{
int i; if(argc<2)
{
yylex();
return 0;
} for(i=1; i < argc; i++)
{
FILE *f = fopen(argv[i],"r"); if(!f){
perror(argv[i]);
return (1);
} //yyrestart使词法分析器从f中读取标准输入文件
yyrestart(f);
yylex();
fclose(f); } return 0; }
测试:
[root@typhoeus79 wc]# more Makefile
test:lex.yy.c
flex test.l
gcc -W -o test lex.yy.c
[root@typhoeus79 wc]#
[root@typhoeus79 wc]# make
flex test.l
gcc -W -o test lex.yy.c
[root@typhoeus79 wc]# more tmp
aaaee AAQQZZ
CCDD 1234
56
[root@typhoeus79 wc]# ./test tmp
CHAR Match=aaaee
SPACE Match=
CHAR Match=AAQQZZ
Enter Match= CHAR Match=CCDD
SPACE Match=
Digitals Match=1234
Enter Match= Digitals Match=56
Enter Match= [root@typhoeus79 wc]#
从输出中可以看出从文件逐个读取,按照模式最大匹配,并存储在yytext中。
例子3:模拟wc的简单例子
[root@typhoeus79 wc]# more wc.l
/*默认是从标准输入输出读取,设置该选项支持从文件读取*/
%option noyywrap %{
int chars = 0;
int lines = 0;
int words = 0; int totchars = 0;
int totlines = 0;
int totwords = 0;
%} %% [a-zA-Z]+ { words++; chars += strlen(yytext); }
\n { lines++; chars++;}
. { chars++ ;} %% main(int argc,char ** argv)
{
int i; if(argc<2)
{
yylex();
printf("%8d%8d%8d\n",lines,words,chars);
return 0;
} for(i=1; i < argc; i++)
{
FILE *f = fopen(argv[i],"r"); if(!f){
perror(argv[i]);
return (1);
} //yyrestart使词法分析器从f中读取标准输入文件
yyrestart(f);
yylex();
fclose(f); printf("%8d%8d%8d\n",lines,words,chars);
totchars += chars; chars = 0;
totwords += words; words = 0;
totlines += lines; lines = 0; } if( argc>1 )
printf("%8d%8d%8d total\n",totlines,totwords,totchars);
return 0; }
例子中具有三种匹配规则:
[a-zA-Z]+匹配1个或者多个字母组成的字符串
\n匹配换行
.匹配除了换行符以外的其他任意单一字符
可以看到规则1和规则3之间可能存在冗余,例如单个字符a,两个规则都可以匹配上,优先匹配规则1,故规则的顺序影响匹配的内容
例子4:词法分析解析算数表达式
%option noyywrap %%
"+" { printf("PLUS\n"); }
"-" { printf("SUBS\n"); }
"*" { printf("MULT\n"); }
"/" { printf("DIVDE\n"); } [0-9]+ { printf("NUMBER %s\n",yytext); }
[ \t ] {}
\n { printf("NEWLINE\n"); } . { printf("Mystery character %s\n",yytext); } %%
测试例子:
[root@typhoeus79 flex]# ./test
5 6 / 7q
NUMBER 5
NUMBER 6
DIVDE
NUMBER 7
Mystery character q
NEWLINE
12+34
NUMBER 12
PLUS
NUMBER 34
NEWLINE
flex词法解析的更多相关文章
- Atiit 如何手写词法解析器
Atiit 如何手写词法解析器 1.1. 通过编程直接从正则->nfa->dfa->表驱动词法解析一条龙自动生成.那是用程序自动生成是需要这样的,自己手写完全不必要这么复杂1 1.2 ...
- jQuery-1.9.1源码分析系列(三) Sizzle选择器引擎——词法解析
jQuery源码9600多行,而Sizzle引擎就独占近2000行,占了1/5.Sizzle引擎.jQuery事件机制.ajax是整个jQuery的核心,也是jQuery技术精华的体现.里面的有些策略 ...
- 分析Sizzle引擎 - 词法解析
分析Sizzle引擎 - 词法解析 声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 浏览器从下载文档到显示页面的过程是个复杂的过程,这里包含了重绘和重排.各家浏览器引擎的工 ...
- Python_编程题集_001_词法解析
1.词法解析: 我的是名字是ths,今年18岁 语法分析后得到结果如下: 数字:18 中文:我的名字是 今年 岁 拼音:ths 符号:,. 请编写程序实现该词法分析功能 string模块解: impo ...
- jQuery 2.0.3 源码分析Sizzle引擎 - 词法解析
声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 浏览器从下载文档到显示页面的过程是个复杂的过程,这里包含了重绘和重排.各家浏览器引擎的工作原理略有差别,但也有一定规则. 简 ...
- boost之词法解析器spirit
摘要:解析器就是编译原理中的语言的词法分析器,可以按照文法规则提取字符或者单词.功能:接受扫描器的输入,并根据语法规则对输入流进行匹配,匹配成功后执行语义动作,进行输入数据的处理. C++ 程序员需要 ...
- flex容器解析
通常在Flex种有两种形式的容器:布局和导航. 在容器中我们可以同时设置一些空间和子容器,我们可以叫在容器内定义的任何组件为该容器的孩子. 在一个Flex程序的根部是一个叫做Application C ...
- 自制操作系统Antz(14)——实现内置编程语言(词法解析器)
AntzScript
- 词法解析 用reactjs和bootstrap创建页面IDE
随机推荐
- WPF控件 在XP下获得焦点有虚线框
所有 Button.ListBox等控件获得焦点时有虚线框.如图:选中523这个按钮就出线虚框. 我在App.xaml中添加适应所有按钮的样式,无效 <Style TargetType=&qu ...
- Qt+VS2015应用程序发布
本文以Qt 5.9.1+VS2015编译环境为例介绍应用程序发布流程,也适用于Qt+mingw的情况. 1. Qt依赖库 将需要发布的exe(如test.exe),放到单独的目录. 在"开始 ...
- MySQL中变量的总结
本文对MySQL中局部变量.用户变量.系统变量的理解进行总结. 一.局部变量 局部变量由DECLARE语句声明: DECLARE var_name[,...] type [DEFAULT value] ...
- Linux下文件打包与解压缩
Linux上存在的文件后缀 文件后缀名 说明 *.zip zip程序打包压缩的文件 *.rar rar程序压缩的文件 *.7z 7zip程序压缩的文件 *.tar tar程序打包,未压缩的文件 *.g ...
- 翻译:MLAPP(2.3节 一些常见的离散分布)
笔者:尝试翻译MLAPP(Machine Learning: a Probabilistic Perspective)一书,供机器学习的学者参考,如有错误理解之处请指出,不胜感激!(如需转载,请联系本 ...
- URL的编码和解码
URL的编码和解码 参考:阮一峰--关于URL编码 1 为什么要URL编码 在因特网上传送URL,只能采用ASCII字符集 也就是说URL只能使用英文字母.阿拉伯数字和某些标点符号,不能使用其他文字和 ...
- 2017年11月Dyn365/CRM用户社区活动报名
UG是全球最大Dynamics的用户组织,由最终用户自发组织,由行业有经验的专家自愿贡献知识和经验的非营利机构,与会人员本着务实中立的态度,不进行推介产品,服务以及其他营销行为.在美国,微软Dynam ...
- LeetCode Questions List (LeetCode 问题列表)- Java Solutions
因为在开始写这个博客之前,已经刷了100题了,所以现在还是有很多题目没有加进来,为了方便查找哪些没加进来,先列一个表可以比较清楚的查看,也方便给大家查找.如果有哪些题目的链接有错误,请大家留言和谅解, ...
- LeetCode 665. Non-decreasing Array (不递减数组)
Given an array with n integers, your task is to check if it could become non-decreasing by modifying ...
- Appium python自动化测试系列之页面滑动原理讲解(十)
10.1.1 页面滑动原理分析 在页面滑动查找章节我们就讲了滑动的知识点,只是不知道大家是否有认真练习以及去理解,如果你认真练习.理解了那么我相信这一章节的东西不用看也能够完成,下面我们还是简单分析一 ...