结对编程

Pathner 濮成林(博客:http://www.cnblogs.com/charliePU/

1.词频统计

环境依赖:

  • 开发环境。myeclipse 2013, jdk1.7.0_04, echart.mini.js, tomcat 7.0.
  • 运行环境。tomcat 7.0, jre7.

对濮成林词频统计进行需求的再讨论

确定输入:TXT格式纯英文文档大小不超过10M

分析结果排序:按顺序输出前N个

结果显示内容:显示内容在原有基础上增加排序结果显示、增加文章标题显示、修改横坐标为斜向60°、考虑加入百分比

数据库:确认不用数据库(单纯在线统计)

整体系统功能: 在线统计用户提交的符合要求的英文文档中的单词总个数,并统计每个单词出现的次数将结果以图表(柱状图)的形式进行呈现。

1. 上传文档

2. 统计所有单词数目(暂时将复数形式认定为单独词、缩写形式暂不支持)

3. 统计文档的总行数。

4. 统计文档中相邻两个单词出现的次数(简单意义上的词组词频分析)

5. 按词频的数量从大到小进行排序

6. 图表显示数据。

项目git地址:https://github.com/puchenglin/WordFrequencyStatisticSys.git

2.结对体会

在针对Pathner 濮成林的词频统计进行改进的过程中,他首先向我讲了一下代码的整体流程,然后向我演示了程序,之后我看了他的代码同时问了他一些具体的内容。

我们在先讨论了一下他的系统的整体需求,然后加入了一些新的内容对代码进行了调整。

在整个过程中,我们讲出各自的想法然后讨论交流,最后确认之后进行代码修改。

代码review过程中,具体的实现上也有一些分歧,感觉变更并不大,但是中间出现了不少小问题耽误了一些时间。

体会:

以前我们也一起讨论过不少在各自编程中遇到的问题,但是由于不了解具体内容往往无法戳中要点,但是不得不说的是,当你在遇到问题而烦躁的时候,找个人交流一下问题,即使无法得到解决方法,也会使自己的思维有改变。

结对编程能是双方互相督促,一个人工作的时候另一个人可以充当一下程序猿鼓励师

由于各自的编程习惯不同,代码看起来有点乱(规范很重要啊)

思考问题的角度不同遇到问题想到的解决方法也不一样,多个思路多条活路吧。

一个人工作一个人思考,轮流进行,以至于身体不会很疲惫

出错后找原因有点小麻烦(看别人的代码果然不是一件简单的事情:规范确实很重要)

结对&词频统计的更多相关文章

  1. 软工结对项目之词频统计update

    队友 胡展瑞 031602215 作业页面 GitHub 具体分工 111500206 赵畅:负责WordCount的升级,添加新的命令行参数支持(自定义输入输出文件,权重词频统计,词组统计等所有新功 ...

  2. 论文爬取 & 词频统计2.0

    一.Github地址      课程项目要求    队友博客 二.具体分工 031602225 林煌伟 :负责C++部分主要功能函数的编写,算法的设计以及改进优化 031602230 卢恺翔 : 爬虫 ...

  3. 作业3-个人项目<词频统计>

    上了一天的课,现在终于可以静下来更新我的博客了.       越来越发现,写博客是一种享受.来看看这次小林老师的“作战任务”.                词频统计 单词: 包含有4个或4个以上的字 ...

  4. C语言实现词频统计——第二版

    原需求 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符. 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 新需求: 1.小文件输入. 为表明程序能跑 2.支持命 ...

  5. c语言实现词频统计

    需求: 1.设计一个词频统计软件,统计给定英文文章的单词频率. 2.文章中包含的标点不计入统计. 3.将统计结果以从大到小的排序方式输出. 设计: 1.因为是跨专业0.0···并不会c++和java, ...

  6. 软件工程第一次个人项目——词频统计by11061153柴泽华

    一.预计工程设计时间 明确要求: 15min: 查阅资料: 1h: 学习C++基础知识与特性: 4-5h: 主函数编写及输入输出部分: 0.5h: 文件的遍历: 1h: 编写两种模式的词频统计函数: ...

  7. python瓦登尔湖词频统计

    #瓦登尔湖词频统计: import string path = 'D:/python3/Walden.txt' with open(path,'r',encoding= 'utf-8') as tex ...

  8. Hadoop上的中文分词与词频统计实践 (有待学习 http://www.cnblogs.com/jiejue/archive/2012/12/16/2820788.html)

    解决问题的方案 Hadoop上的中文分词与词频统计实践 首先来推荐相关材料:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-c ...

  9. pyspark进行词频统计并返回topN

    Part I:词频统计并返回topN 统计的文本数据: what do you do how do you do how do you do how are you from operator imp ...

随机推荐

  1. 028、HTML 标签2超链接,框架标签

    内容:超链接,框架标签############################################################## <!-- 超链接 --> <a h ...

  2. [python]如何理解uiautomator里面的 instance 及使用场景

    通过uiautomatorviewer打开之后,需要通过对某个控件进行操作,但在当前界面中该控件所有属性无法唯一(其它控件属性也是一样),这个时候就需要借助实例(instance)来进行区分,inst ...

  3. Android常见UI组件之ListView(一)

    使用ListView显示一个长的项列表 1.新建一个名为"BasicView5"的Android项目. 2.改动BasicView5.java文件.改动后的程序例如以下: pack ...

  4. 死磕nginx系列--nginx 限流配置

    限流算法 令牌桶算法 算法思想是: 令牌以固定速率产生,并缓存到令牌桶中: 令牌桶放满时,多余的令牌被丢弃: 请求要消耗等比例的令牌才能被处理: 令牌不够时,请求被缓存. 漏桶算法 算法思想是: 水( ...

  5. 为什么Github要把代码合并请求称为pull request而不是push request?

    问题: 我的理解是:我做了一些修改,我请求把我的修改push到你的仓库,然后你review一下我的代码,如果没问题就接受请求merge,这样的话叫做push request岂不是更合适?因为这个操作是 ...

  6. IIS7.5全站301跳转,内页+带参数url,这才是真正的全站跳转

    说好的转型安全领域,可是我还是忍不住要给大家分享这个教程.因为这个问题很常见,大部分人都遇到了(可能你没注意),困扰了我很久,相信这是一篇真正适合你的IIS301跳转教程. 背景 说到301跳转,作为 ...

  7. Python2.7-csv

    csv模块,用于读写 csv 文件,常用 reader 和 writer 对象进行操作 1.模块的类 1.1 Dialect 对象,设置 csv 文件的各种格式,包括分隔符,引用符,转义符等 1.1. ...

  8. 配置openfire环境

    Openfire 的安装和配置 1. 下载最新的openfire安装文件 官方下载站点:http://www.igniterealtime.org/downloads/index.jsp#openfi ...

  9. Android 网络请求超时处理方案

    以用户登录为例介绍用户访问网络时的请求超时处理的两种方法: 1)使用android提供的工具类AsyncTask类,此类提供了一个AsyncTask.execute().get(timeout, un ...

  10. P3195 [HNOI2008]玩具装箱TOY

    列出DP方程式:设f[i]表示分组完前i件物品的最小花费,为方便计算,设sum[i]表示是前i件物品的长度和. f[i]=min(f[j]+(sum[i]-sum[j]+i-j-L-1)^2) [0& ...