结对&词频统计
结对编程
Pathner 濮成林(博客:http://www.cnblogs.com/charliePU/)
1.词频统计
环境依赖:
- 开发环境。myeclipse 2013, jdk1.7.0_04, echart.mini.js, tomcat 7.0.
- 运行环境。tomcat 7.0, jre7.
对濮成林词频统计进行需求的再讨论
确定输入:TXT格式纯英文文档大小不超过10M
分析结果排序:按顺序输出前N个
结果显示内容:显示内容在原有基础上增加排序结果显示、增加文章标题显示、修改横坐标为斜向60°、考虑加入百分比
数据库:确认不用数据库(单纯在线统计)
整体系统功能: 在线统计用户提交的符合要求的英文文档中的单词总个数,并统计每个单词出现的次数将结果以图表(柱状图)的形式进行呈现。
1. 上传文档
2. 统计所有单词数目(暂时将复数形式认定为单独词、缩写形式暂不支持)
3. 统计文档的总行数。
4. 统计文档中相邻两个单词出现的次数(简单意义上的词组词频分析)
5. 按词频的数量从大到小进行排序
6. 图表显示数据。
项目git地址:https://github.com/puchenglin/WordFrequencyStatisticSys.git
2.结对体会
在针对Pathner 濮成林的词频统计进行改进的过程中,他首先向我讲了一下代码的整体流程,然后向我演示了程序,之后我看了他的代码同时问了他一些具体的内容。
我们在先讨论了一下他的系统的整体需求,然后加入了一些新的内容对代码进行了调整。
在整个过程中,我们讲出各自的想法然后讨论交流,最后确认之后进行代码修改。
代码review过程中,具体的实现上也有一些分歧,感觉变更并不大,但是中间出现了不少小问题耽误了一些时间。
体会:
以前我们也一起讨论过不少在各自编程中遇到的问题,但是由于不了解具体内容往往无法戳中要点,但是不得不说的是,当你在遇到问题而烦躁的时候,找个人交流一下问题,即使无法得到解决方法,也会使自己的思维有改变。
结对编程能是双方互相督促,一个人工作的时候另一个人可以充当一下程序猿鼓励师
由于各自的编程习惯不同,代码看起来有点乱(规范很重要啊)
思考问题的角度不同遇到问题想到的解决方法也不一样,多个思路多条活路吧。
一个人工作一个人思考,轮流进行,以至于身体不会很疲惫
出错后找原因有点小麻烦(看别人的代码果然不是一件简单的事情:规范确实很重要)
结对&词频统计的更多相关文章
- 软工结对项目之词频统计update
队友 胡展瑞 031602215 作业页面 GitHub 具体分工 111500206 赵畅:负责WordCount的升级,添加新的命令行参数支持(自定义输入输出文件,权重词频统计,词组统计等所有新功 ...
- 论文爬取 & 词频统计2.0
一.Github地址 课程项目要求 队友博客 二.具体分工 031602225 林煌伟 :负责C++部分主要功能函数的编写,算法的设计以及改进优化 031602230 卢恺翔 : 爬虫 ...
- 作业3-个人项目<词频统计>
上了一天的课,现在终于可以静下来更新我的博客了. 越来越发现,写博客是一种享受.来看看这次小林老师的“作战任务”. 词频统计 单词: 包含有4个或4个以上的字 ...
- C语言实现词频统计——第二版
原需求 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符. 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 新需求: 1.小文件输入. 为表明程序能跑 2.支持命 ...
- c语言实现词频统计
需求: 1.设计一个词频统计软件,统计给定英文文章的单词频率. 2.文章中包含的标点不计入统计. 3.将统计结果以从大到小的排序方式输出. 设计: 1.因为是跨专业0.0···并不会c++和java, ...
- 软件工程第一次个人项目——词频统计by11061153柴泽华
一.预计工程设计时间 明确要求: 15min: 查阅资料: 1h: 学习C++基础知识与特性: 4-5h: 主函数编写及输入输出部分: 0.5h: 文件的遍历: 1h: 编写两种模式的词频统计函数: ...
- python瓦登尔湖词频统计
#瓦登尔湖词频统计: import string path = 'D:/python3/Walden.txt' with open(path,'r',encoding= 'utf-8') as tex ...
- Hadoop上的中文分词与词频统计实践 (有待学习 http://www.cnblogs.com/jiejue/archive/2012/12/16/2820788.html)
解决问题的方案 Hadoop上的中文分词与词频统计实践 首先来推荐相关材料:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-c ...
- pyspark进行词频统计并返回topN
Part I:词频统计并返回topN 统计的文本数据: what do you do how do you do how do you do how are you from operator imp ...
随机推荐
- November 04th, 2017 Week 44th Saturday
It does not do to dwell on dreams and forget to live. 整天沉溺于梦想而忘记如何好好生活,毫无意义. Bingo, and I think it i ...
- 模拟的confirm
<!DOCTYPE html> <html> <head> <meta charset="utf-8"/> <title> ...
- [BUG] python实例化N次类,调用类函数log会输出N遍的bug 解决办法
最近再写DOU用例时,采用的是 unittest测试框架,就涉及到将其它所有模块需要全部在一个 .py文件中进行实例化,然后再运行时发现在控制台中同一个日志信息会打印多次(实例化几次,同一消息就会打印 ...
- 如何弹出QQ临时对话框实现不添加好友在线交谈效果
如何不添加好友弹出QQ临时对话框实现在线交谈效果,这样的一个需求,我们真的是太需要了,实现起来也很简单,一行代码即可搞定,需要的朋友可以参考下 其实这个很简单,在img我们加入一个a标签,然后 < ...
- cocos2d-x2.2.3学习
cocos2d-x2.2.3抛弃了原先的vs模板,改为python创建项目,详细什么原因我不是非常清楚啊,可能更方便些吧. 毕竟用pythone能够一下子创建很多不同平台的项目,让项目移植更方便些.可 ...
- BZOJ1121:[POI2008]激光发射器SZK(乱搞)
Description 多边形相邻边垂直,边长为整数,边平行坐标轴.要在多边形的点上放一些激光发射器和接收器.满足下列要求: 1发射器和接收器不能放置在同一点: 2发射器发出激光可以沿壁反射,最终到达 ...
- Android github上的好的开源项目汇总
转自:http://blog.csdn.net/ithomer/article/details/8882236 GitHub 上的开源项目不胜枚举,越来越多的开源项目正在迁移到GitHub平台上.基于 ...
- centos6.4安装 zabbix agent
1.防火墙设置 允许zabbix-agent的10050端口通过 iptables -A INPUT -p tcp --dport 10050 -j ACCEPT 2.安装zabbix agent ...
- OO第9~11次作业总结
规格化设计调研 大致发展历史 --> 自给自足的私人化的软件生产方式. --> 落后的软件生产方式无法满足迅速增长的计算机软件需求,软件的开发与维护出现一系列严重问题. --> 正式 ...
- 服务器端数据合法性验证:签名sign和口令token原理
有时候,你也许会想: 我写的接口,那别人要是知道url,并且知道其需要的数据结构和逻辑,那不是都可以访问了? 甚至是,客户点传递过来的数据,是不是被恶意修改了? 这时,我们可能需要“验证”一下.比如: ...