UnitOneSummary
目录
- 一、程序结构分析
- 第一次作业
- 第二次作业
- 第三次作业
- 二、Test & Bugs
- 三、设计模式
- 四、总结与反思
一、程序结构分析
第一次作业
思路:
1.输入预处理:
- 去除空格和\t
- 替换++、--、+-、-+
- 将+x,-x,x+,x-替换成+1*x,-1*x,x**1+,x**1-。至此已将输入中的每一项全部替换成[+-]\d+*x**[+-]?\d+
- 最后用正则提取每一项
2.合并化简求导
HashMap<BigInteger, BigInteger>存储用正则提取的项的系数,指数,边提取,边比较,边化简
3.关于格式化输出
因为系数和指数都是整数,所以求导之后只有指数是-2的项需要考虑系数是否为1或-1
求导之后指数是0,直接输出系数;指数是1,如果系数还是1或-1,那么求导之前项的系数只能是分数,如果只按指数讨论,笔者的格式化输出逻辑减少5-6行,当然你也可以像第一次实验的输出要求一样讨论
UML:

LinesCounter:第一次代码总行数128

Metrics:第一次作业尚未飘红

第二次作业
思路:
1.判断表达式合法
- 去除空格和\t
- 判断是否为空串
- 以项为单位构造正则,逐项匹配
2.合并因子并求导:
构建求导的抽象类,每种函数继承抽象类,方便合并因子及求导
3.化简:
合并同类项:
对于x,sin,cos的指数相同的两项,合并系数:重写了hashcode和equal方法,把x,sin,cos的指数当成三元组,把三元组当成Hashmap的key,系数当成Hashmap的value,通过判断是否containkey,进行同类项的合并
分类:
按照x的指数分类,将系数,sin的指数,cos的指数当成三元组
对于指数不同的项无需考虑三角函数的化简
对于每个x的指数对应的若干三元组深搜剪枝化简:
设sin指数为m,cos指数为n,则对于①(m,n) ②(m,n+2) ③(m+2,n)
①②③任选两者的组合都可以转换成另选两组的组合。为方便讨论,设两项的公共部分为F,详细讨论如下:
①+② <--> ①+③:a*F+b*F*cos(x)**2 <--> (a+b)*F-b*F*sin(x)**2
②+③ <--> ①+②:a*F*sin(x)**2+b*F*cos(x)**2 <--> a*F+(b-a)*F*cos(x)**2
①+③ <--> ②+③:a*F*sin(x)**2+b*F <--> (a+b)*F*sin(x)**2+b*F*cos(x)**2
类似转换方式还有:
a*F*cos(x)**2+b*F <--> -a*F*sin(x)**2+(a+b)*F
a*F*cos(x)**2+b*F*sin(x)**2 <--> a*F+(b-a)*F*sin(x)**2
a*F+b*F*sin(x)**2 <--> a*F*cos(x)**2+(a+b)*F*sin(x)**2
利用可能使结果长度缩短的以上转换,进行深搜剪枝化简
深搜:
标记+回溯,对于每个没有被访问的三元组,尝试按照6种转化形式变换,递归到底之后判断总长度是否减小
剪枝:
采用贪心的思想,每次转换同时将转换之前的项设置成对照,如果未能使长度减小,直接return
熔断:
根据第二次评测机2s限定的CPU时间,设定深搜部分的时间阈值1000ms,即超过1000ms之后直接throw exception
4.格式化输出:
重写toString
类之间的逻辑和调用关系:

LinesCounter:第二次代码总行数733

Metrics:化简部分的复杂度较高

第三次作业
思路:
1.判断表达式合法:
- 排除空串(只有空格和\t的也算作空串)
- 排除非法字符
- 排除空格引发WF的情况
- 排除非法阶乘
- 排除非法三角函数
- 排除非法数字
- 去掉空格和制表符
- 排除非法加法减法符号
- 排除非法指数和底数
- 排除不匹配的括号
2.求导:
只对表达式因子和嵌套类的三角函数建树处理,其余正常处理。建树时按照优先级嵌套>乘法>加法=减法,设置权重,方便建树
3.化简:
求导结果只有*,+,-,所以递归化简,去除多余的0,1,括号
4.格式化输出:
重写toString
类之间的逻辑和调用关系:

LinesCounter:第三次作业总行数1508

Metrics:由于循环和判断逻辑较多,所以大面积飘红

二、Test & Bugs
Test:
在第一次作业强测之前已搭建好评测机,三次作业使用只需改变生成数据的正则
思路:
- 1.用xeger根据自己设计的正则表达式批量生成测试数据的文件input.txt
- 2.然后将input.txt逐行作为输入 ,运行.class 获得输出文件tmpOutput.txt
- 3.然后对tmpOutput.txt的内容采用sympy进行表达式求值(比如代入x=2),获得输出文件myOutput.txt
- 4.用sympy包对input.txt的内容逐行求导并进行表达式求值,令x=2,获得输出文件correctOutput.txt
- 5.比较myOutput.txt和correctOutput.txt,如果存在不同,根据行数查找input.txt的测试数据
按照1-5的逻辑编写.sh ,bash运行完成黑盒测试
具体细节处理:
1.1去除生成数据的前导0
#去除前导0
str = re.sub(r'(?<!\d)0+(?=\d)', "", str)
1.2 代入2计算
result = int(expr.evalf(subs={x: 2}))
1.3 使用管道,简化sh编写
cat $InputFileName | while read line
do
...
correctOutput=$(echo "$line" | python diff.py)
result=$(echo "$myOutPut$space$correctOutput" | python compare.py)
...
done
另一种测试方法:Junit
//本次主要使用sh
import org.junit.Test;
import JUnitTestTools.EnhancedUserTestTools;
import java.io.File;
public class PolyTest {
@Test
public void main() throws Exception {
new EnhancedUserTestTools(Poly.class, 2000).testAll(new File("./test/poly/test1.txt"));
}
}
Bugs
强测:
三次强测均未测出bug
hacked:
三次互测均未被hack
hack:
三次互测平均每次hack非同质bug2个,其中主要是输出时toString的逻辑和细节处理,以及第三次作业存在的优化过度的问题。
三、设计模式
主要采用工厂模式。
第一次作业由于仅用128行实现,没有考虑向后兼容性,所以没有设计工厂(之后单元应该着重注意代码向后兼容的能力)
第二次作业考虑了向后兼容性,设计了抽象类,sin,cos,pow,const均继承抽象类,搭建工厂
第三次作业在第二次作业的基础上,实现递归逻辑。配合树结构的使用,保证了正确性
四、总结与反思
三次作业主要锻炼了各个容器的使用,工厂模式的应用,优化方式的探索。虽然三次作业的完成都保证了正确性,但尚有很多不足。比如第三次作业中采用二叉树的结构,①是给后续的化简带来极大的困难,②是树结构与业务逻辑紧密绑定,可能无法满足后续的扩展要求。但是如果设计一个统一的item接口,然后不仅让sin,cos,pow,const实现这个接口,而且让各个组合项+,-,*,嵌套也实现这个接口,只需要组合项是内置两个item一个operator,不仅方便化简,而且无需采用树结构,简化代码逻辑,同时能保证向后兼容性,无论之后出现新的因子,还是新的组合模式,只要实例接口即可。
相比于正确实现功能,个人认为优化部分更具有挑战性,尤其是在优化的同时,保证正确性,而不是因为20分失去应得的80分。比如在第二次作业中,采用了dfs深搜的优化方式,但可能会出现TLE的问题,所以要设置熔断。在第三次作业中,如果采用二叉树,可能面临无从化简的处境。
UnitOneSummary的更多相关文章
随机推荐
- js 脏检测
参考 基础知识 <!DOCTYPE html> <html lang="en"> <head> <meta charset="U ...
- vux使用
Vue中使用vux的配置,分为两种情况: 一.根据vux文档直接安装,无需手动配置 npm install vue-cli -g // 如果还没安装 vue init airyland/vux2 my ...
- 调整是为了更好的上涨,牛市下的SPC空投来了!
2021年刚过没几天,比特币就开启了牛市的旅程,BTC涨到4万美元,ETH涨到1300多美元,BGV也涨到了621.05美元,牛市已然来袭. 虽然从近两日,比特币带领着主流币进行了一波调整,但是只涨不 ...
- RocketMq灰皮书(三)------MQ使用
RocketMq灰皮书(三)------MQ使用 在使用MQ之前,我们回顾一下前两篇博文的内容. 我们大致了解了RocketMQ的四个概念,分别是:Producer,Consumer,Message和 ...
- Redis-第九章节-动态字符串
目录 概述 SDS(动态字符串) SDS(动态字符串)与c语言字符串的区别 1.概述 String类型底层实现的简单动态字符串sds,是可以修改的字符串.它采用预分配冗余空间的方式来减少内存的频繁分配 ...
- CMD 中运行 xx 命令提示 不是内部或外部命令,也不是可运行的程序或批处理文件的问题
出现这个问题的原因一般有2个 这个命令依赖某个软件,而你又没有安装 这里你只需要去下载安装好对应的软件,基本上就可以解决上面的问题了. 软件安装好了,但是需要配置环境变量 第二个原因就按照下图,去设置 ...
- Linux之根目录说明
文件系统 文件系统是操作系统用于明确存储设备(常见的是磁盘,也有基于NAND Flash的固态硬盘)或分区上的文件的方法和数据结构:即在存储设备上组织文件的方法.操作系统中负责管理和存储文件信息的软件 ...
- eclipse快速定位当前类所在位置
如何快速的找到一个类并且定位它所在的位置呢?这里以搜索Menu类为例说明. 可以通过CTRL + SHIFT +R的组合键,输入Menu 双击Menu.java即可跳转到对应的类上,但此时还不知道此类 ...
- Svelte v2 已经过时了!
带你走马观花,细看新版变化. 注意:原文发表于2018-04-18,随着框架不断演进,部分内容可能已不适用. 大约是一年之前,我们首次在 Svelte 的 issue 跟踪器上讨论过 v2 版本,现在 ...
- 写了一个vue+antdv的后台管理模板
1,项目简介 写在前面===>这是一个vue+antdv的后台管理模板 项目地址: https://github.com/BaiFangZi/vue-antd-manage 1.1,概述 最 ...