结对编程

Pathner 濮成林(博客:http://www.cnblogs.com/charliePU/

1.词频统计

环境依赖:

  • 开发环境。myeclipse 2013, jdk1.7.0_04, echart.mini.js, tomcat 7.0.
  • 运行环境。tomcat 7.0, jre7.

对濮成林词频统计进行需求的再讨论

确定输入:TXT格式纯英文文档大小不超过10M

分析结果排序:按顺序输出前N个

结果显示内容:显示内容在原有基础上增加排序结果显示、增加文章标题显示、修改横坐标为斜向60°、考虑加入百分比

数据库:确认不用数据库(单纯在线统计)

整体系统功能: 在线统计用户提交的符合要求的英文文档中的单词总个数,并统计每个单词出现的次数将结果以图表(柱状图)的形式进行呈现。

1. 上传文档

2. 统计所有单词数目(暂时将复数形式认定为单独词、缩写形式暂不支持)

3. 统计文档的总行数。

4. 统计文档中相邻两个单词出现的次数(简单意义上的词组词频分析)

5. 按词频的数量从大到小进行排序

6. 图表显示数据。

项目git地址:https://github.com/puchenglin/WordFrequencyStatisticSys.git

2.结对体会

在针对Pathner 濮成林的词频统计进行改进的过程中,他首先向我讲了一下代码的整体流程,然后向我演示了程序,之后我看了他的代码同时问了他一些具体的内容。

我们在先讨论了一下他的系统的整体需求,然后加入了一些新的内容对代码进行了调整。

在整个过程中,我们讲出各自的想法然后讨论交流,最后确认之后进行代码修改。

代码review过程中,具体的实现上也有一些分歧,感觉变更并不大,但是中间出现了不少小问题耽误了一些时间。

体会:

以前我们也一起讨论过不少在各自编程中遇到的问题,但是由于不了解具体内容往往无法戳中要点,但是不得不说的是,当你在遇到问题而烦躁的时候,找个人交流一下问题,即使无法得到解决方法,也会使自己的思维有改变。

结对编程能是双方互相督促,一个人工作的时候另一个人可以充当一下程序猿鼓励师

由于各自的编程习惯不同,代码看起来有点乱(规范很重要啊)

思考问题的角度不同遇到问题想到的解决方法也不一样,多个思路多条活路吧。

一个人工作一个人思考,轮流进行,以至于身体不会很疲惫

出错后找原因有点小麻烦(看别人的代码果然不是一件简单的事情:规范确实很重要)

结对&词频统计的更多相关文章

  1. 软工结对项目之词频统计update

    队友 胡展瑞 031602215 作业页面 GitHub 具体分工 111500206 赵畅:负责WordCount的升级,添加新的命令行参数支持(自定义输入输出文件,权重词频统计,词组统计等所有新功 ...

  2. 论文爬取 & 词频统计2.0

    一.Github地址      课程项目要求    队友博客 二.具体分工 031602225 林煌伟 :负责C++部分主要功能函数的编写,算法的设计以及改进优化 031602230 卢恺翔 : 爬虫 ...

  3. 作业3-个人项目<词频统计>

    上了一天的课,现在终于可以静下来更新我的博客了.       越来越发现,写博客是一种享受.来看看这次小林老师的“作战任务”.                词频统计 单词: 包含有4个或4个以上的字 ...

  4. C语言实现词频统计——第二版

    原需求 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符. 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 新需求: 1.小文件输入. 为表明程序能跑 2.支持命 ...

  5. c语言实现词频统计

    需求: 1.设计一个词频统计软件,统计给定英文文章的单词频率. 2.文章中包含的标点不计入统计. 3.将统计结果以从大到小的排序方式输出. 设计: 1.因为是跨专业0.0···并不会c++和java, ...

  6. 软件工程第一次个人项目——词频统计by11061153柴泽华

    一.预计工程设计时间 明确要求: 15min: 查阅资料: 1h: 学习C++基础知识与特性: 4-5h: 主函数编写及输入输出部分: 0.5h: 文件的遍历: 1h: 编写两种模式的词频统计函数: ...

  7. python瓦登尔湖词频统计

    #瓦登尔湖词频统计: import string path = 'D:/python3/Walden.txt' with open(path,'r',encoding= 'utf-8') as tex ...

  8. Hadoop上的中文分词与词频统计实践 (有待学习 http://www.cnblogs.com/jiejue/archive/2012/12/16/2820788.html)

    解决问题的方案 Hadoop上的中文分词与词频统计实践 首先来推荐相关材料:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-c ...

  9. pyspark进行词频统计并返回topN

    Part I:词频统计并返回topN 统计的文本数据: what do you do how do you do how do you do how are you from operator imp ...

随机推荐

  1. November 04th, 2017 Week 44th Saturday

    It does not do to dwell on dreams and forget to live. 整天沉溺于梦想而忘记如何好好生活,毫无意义. Bingo, and I think it i ...

  2. 模拟的confirm

    <!DOCTYPE html> <html> <head> <meta charset="utf-8"/> <title> ...

  3. [BUG] python实例化N次类,调用类函数log会输出N遍的bug 解决办法

    最近再写DOU用例时,采用的是 unittest测试框架,就涉及到将其它所有模块需要全部在一个 .py文件中进行实例化,然后再运行时发现在控制台中同一个日志信息会打印多次(实例化几次,同一消息就会打印 ...

  4. 如何弹出QQ临时对话框实现不添加好友在线交谈效果

    如何不添加好友弹出QQ临时对话框实现在线交谈效果,这样的一个需求,我们真的是太需要了,实现起来也很简单,一行代码即可搞定,需要的朋友可以参考下 其实这个很简单,在img我们加入一个a标签,然后 < ...

  5. cocos2d-x2.2.3学习

    cocos2d-x2.2.3抛弃了原先的vs模板,改为python创建项目,详细什么原因我不是非常清楚啊,可能更方便些吧. 毕竟用pythone能够一下子创建很多不同平台的项目,让项目移植更方便些.可 ...

  6. BZOJ1121:[POI2008]激光发射器SZK(乱搞)

    Description 多边形相邻边垂直,边长为整数,边平行坐标轴.要在多边形的点上放一些激光发射器和接收器.满足下列要求: 1发射器和接收器不能放置在同一点: 2发射器发出激光可以沿壁反射,最终到达 ...

  7. Android github上的好的开源项目汇总

    转自:http://blog.csdn.net/ithomer/article/details/8882236 GitHub 上的开源项目不胜枚举,越来越多的开源项目正在迁移到GitHub平台上.基于 ...

  8. centos6.4安装 zabbix agent

    1.防火墙设置 允许zabbix-agent的10050端口通过  iptables -A INPUT -p tcp --dport 10050 -j ACCEPT  2.安装zabbix agent ...

  9. OO第9~11次作业总结

    规格化设计调研 大致发展历史 --> 自给自足的私人化的软件生产方式. --> 落后的软件生产方式无法满足迅速增长的计算机软件需求,软件的开发与维护出现一系列严重问题. --> 正式 ...

  10. 服务器端数据合法性验证:签名sign和口令token原理

    有时候,你也许会想: 我写的接口,那别人要是知道url,并且知道其需要的数据结构和逻辑,那不是都可以访问了? 甚至是,客户点传递过来的数据,是不是被恶意修改了? 这时,我们可能需要“验证”一下.比如: ...