结对编程

Pathner 濮成林(博客:http://www.cnblogs.com/charliePU/

1.词频统计

环境依赖:

  • 开发环境。myeclipse 2013, jdk1.7.0_04, echart.mini.js, tomcat 7.0.
  • 运行环境。tomcat 7.0, jre7.

对濮成林词频统计进行需求的再讨论

确定输入:TXT格式纯英文文档大小不超过10M

分析结果排序:按顺序输出前N个

结果显示内容:显示内容在原有基础上增加排序结果显示、增加文章标题显示、修改横坐标为斜向60°、考虑加入百分比

数据库:确认不用数据库(单纯在线统计)

整体系统功能: 在线统计用户提交的符合要求的英文文档中的单词总个数,并统计每个单词出现的次数将结果以图表(柱状图)的形式进行呈现。

1. 上传文档

2. 统计所有单词数目(暂时将复数形式认定为单独词、缩写形式暂不支持)

3. 统计文档的总行数。

4. 统计文档中相邻两个单词出现的次数(简单意义上的词组词频分析)

5. 按词频的数量从大到小进行排序

6. 图表显示数据。

项目git地址:https://github.com/puchenglin/WordFrequencyStatisticSys.git

2.结对体会

在针对Pathner 濮成林的词频统计进行改进的过程中,他首先向我讲了一下代码的整体流程,然后向我演示了程序,之后我看了他的代码同时问了他一些具体的内容。

我们在先讨论了一下他的系统的整体需求,然后加入了一些新的内容对代码进行了调整。

在整个过程中,我们讲出各自的想法然后讨论交流,最后确认之后进行代码修改。

代码review过程中,具体的实现上也有一些分歧,感觉变更并不大,但是中间出现了不少小问题耽误了一些时间。

体会:

以前我们也一起讨论过不少在各自编程中遇到的问题,但是由于不了解具体内容往往无法戳中要点,但是不得不说的是,当你在遇到问题而烦躁的时候,找个人交流一下问题,即使无法得到解决方法,也会使自己的思维有改变。

结对编程能是双方互相督促,一个人工作的时候另一个人可以充当一下程序猿鼓励师

由于各自的编程习惯不同,代码看起来有点乱(规范很重要啊)

思考问题的角度不同遇到问题想到的解决方法也不一样,多个思路多条活路吧。

一个人工作一个人思考,轮流进行,以至于身体不会很疲惫

出错后找原因有点小麻烦(看别人的代码果然不是一件简单的事情:规范确实很重要)

结对&词频统计的更多相关文章

  1. 软工结对项目之词频统计update

    队友 胡展瑞 031602215 作业页面 GitHub 具体分工 111500206 赵畅:负责WordCount的升级,添加新的命令行参数支持(自定义输入输出文件,权重词频统计,词组统计等所有新功 ...

  2. 论文爬取 & 词频统计2.0

    一.Github地址      课程项目要求    队友博客 二.具体分工 031602225 林煌伟 :负责C++部分主要功能函数的编写,算法的设计以及改进优化 031602230 卢恺翔 : 爬虫 ...

  3. 作业3-个人项目<词频统计>

    上了一天的课,现在终于可以静下来更新我的博客了.       越来越发现,写博客是一种享受.来看看这次小林老师的“作战任务”.                词频统计 单词: 包含有4个或4个以上的字 ...

  4. C语言实现词频统计——第二版

    原需求 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符. 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 新需求: 1.小文件输入. 为表明程序能跑 2.支持命 ...

  5. c语言实现词频统计

    需求: 1.设计一个词频统计软件,统计给定英文文章的单词频率. 2.文章中包含的标点不计入统计. 3.将统计结果以从大到小的排序方式输出. 设计: 1.因为是跨专业0.0···并不会c++和java, ...

  6. 软件工程第一次个人项目——词频统计by11061153柴泽华

    一.预计工程设计时间 明确要求: 15min: 查阅资料: 1h: 学习C++基础知识与特性: 4-5h: 主函数编写及输入输出部分: 0.5h: 文件的遍历: 1h: 编写两种模式的词频统计函数: ...

  7. python瓦登尔湖词频统计

    #瓦登尔湖词频统计: import string path = 'D:/python3/Walden.txt' with open(path,'r',encoding= 'utf-8') as tex ...

  8. Hadoop上的中文分词与词频统计实践 (有待学习 http://www.cnblogs.com/jiejue/archive/2012/12/16/2820788.html)

    解决问题的方案 Hadoop上的中文分词与词频统计实践 首先来推荐相关材料:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-c ...

  9. pyspark进行词频统计并返回topN

    Part I:词频统计并返回topN 统计的文本数据: what do you do how do you do how do you do how are you from operator imp ...

随机推荐

  1. redis 持久化与备份策略

    持久化(persistence) 本文是 Redis 持久化文档 的中文翻译. 这篇文章提供了 Redis 持久化的技术性描述,推荐所有 Redis 用户阅读. 要更广泛地了解 Redis 持久化,以 ...

  2. BZOJ 1076 奖励关 状态压缩DP

    题目链接: https://www.lydsy.com/JudgeOnline/problem.php?id=1076 题目大意: 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里, ...

  3. windows下vi/vim编辑器的基本操作

    windows下vi/vim编辑器的基本操作 Contents 1. 工具准备(下载gvim) 2. vi/vim基本入门 2.1. 安装 2.2. 基本使用 3. vi/vim基本命令表 1 工具准 ...

  4. 🈲Eclipse通过jdbc连接数据库制作简单登陆界面【新手必看】

    一.前言: 做网站开发,要求有多种搭配方式,前台技术可以使用PHP.ASP.JSP.ASP.NET.CGI等任何一种: 需要用到的基础语言用的最多的就是HTML/CSS.JS.JAVA.XML这些了, ...

  5. CSS居中布局

    一:水平居中方案: 1.行内元素 设置 text-align:center 2.定宽块状元素 设置 左右 margin 值为 auto 3.不定宽块状元素 a:在元素外加入 table 标签(完整的, ...

  6. pytorch 绘制训练曲线;服务器端训练,本地浏览器显示,本地打不开;tensorboard端口被占

    代码里面用tensorboard保存了训练的日志在logs目录里面 用tensorboard命令打开日志目录:tensorboard --logdir="./logs/" 会显示一 ...

  7. 配置使用;yum安装slatstack的master,minion<at>centos6_x86_64

    使用: ####################################### 配置: ####################################### 安装: 服务端安装: [ ...

  8. Python2.7-functools

    functools 模块,是一个高阶函数模块,很有用,尤其是 partial 函数(类似函数定义了默认参数)和装饰器属性更新函数.装饰器在实现的时候,被修饰后的函数其实已经是另外一个函数了(函数名等函 ...

  9. JAVA框架 Spring AOP注解

    一.准备工作: 1)导入jar包: 4个jar包. 2)约束:(spring需要所有的约束)有IOC约束和AOP 还有事务(tx)以及注解注入的约束(context). <?xml versio ...

  10. day05-列表类型

    列表类型: 用途:存放多个值,根据索引. 定义方式:在[]内用逗号分隔开多个任意类型的值 L1 = list[{a:1,b:2,c:3}] 输出的为字典的key值 常用操作+内置方法 1.按索引取值: ...