1、团队成员简介


  

  左边:马腾跃 右边:陈谋

  

  左上:李剑锋  左下:仉伯龙 右:卢惠明

团队成员及博客:

    李剑锋:        Blog:      http://www.cnblogs.com/Power-Byte/

    陈谋:            Blog:        http://www.cnblogs.com/13061176Terry/

    马腾跃:         Blog:        http://www.cnblogs.com/summerMTY/

    卢惠民:         Blog:        http://www.cnblogs.com/lhm924/

    仉伯龙:         Blog:        http://www.cnblogs.com/zhangbolong/

2、软件工程介绍


项目目标:

    在线问答网站中散落着许多有价值的知识和有借鉴意义的经验,然而对于一个不精通于信息检索的人来说要寻找这些有价值的信息往往要耗费大量时间,甚至根本不能找到,故而本软件在此需求的基础上进行开发,以满足用户对于信息检索,信息筛选,信息翻译,信息可视化等方面的需求。

预期的典型用户:

  软件的用户方一方面是学霸在线教学问答系统后台的开发人员,开发人员可以通过软件提供的接口来直接对于数据进行处理,开发人员具有专业计算机水平,

  软件的用户方另一方面是普通用户,本软件将功能性的模块进行集成与封装并且提供UI接口服务于普通用户对于信息检索,信息筛选,信息翻译,信息可视化等方面的需求。

预期的功能描述:

  软件产品功能主要包括定义在线教学问答网站的内容结构,能够从爬到的内容中抽取元数据并将其纳入到既定的组织结构中,在用户查询时能够给予快速准确的响应,并且支持标签,翻译的功能。

  • 在线问答网站的内容结构定义;

    主要是对在线问答网站的组织进行格式化提取,(包括网站的用户提出的问题,以及其他用户给出的相应的解决方式),然后按照既定的格式整理并且存储到数据库中。

  • 增量式的数据处理;

    对于后续爬取得到的最新数据,能够按照定义好的内容结构准确地合并到已有的内容中。

  • 文本标签;

    对于用户提出的问题所属的类别使用标签进行分类。

  • 文本关键词提取;

    对于问题中所涉及的主要内容以及术语进行分类提取。

  • 文本内容翻译;

    满足基于不同语言背景的用户搜集检索资料的需求。

  • 用户界面与用户进行交互。

    满足界面友好的要求,对于用户来说易于上手,易于使用。

  • 给在线组和app手机客户端组上传数据

    当有需求的时候,我们会给在线组上传一定量的数据,由于给网站上传大量数据的时候会给网站服务器增加负担,有时网站拒绝访问,有时网站崩溃,所以每次我们只上传一定量的数据,从而让上传数据变得稳定。

预期用户

  • 由于我们的应用是给学霸客户端和在线系统使用,所以的目标就是给他们定时提供数据。

3、产品需求及反馈


需求

反馈
1.上传数据(在线组、手机app组)

1.定义Json规格,定义上传文件类型

2.通过Json向Solr这个搜索引擎后台上传数据

2.视频文件(在线组)

1.向爬虫组提出要求,并且定时进行交流。

2.效果不尽如人意

3.问答(在线组、手机app组)

1.刚开始用Stackoverflow的数据进行测试上传

2.实现搜搜问问、百度知道、德问、cnblogs数据处理

4.对标签进行定义(在线组)

1.通过stackoverflow的api对相应的标签进行定义。

2.其他标签从文章中抽取。

5.标签、关键词结果分析(老师)

1.与学长的进行了相应的对比,从F值来看,我们的测试效果比学长高17.8个百分点左右

6.两个后端(老师)

1.将处理数据和上传数据分成两部分,不同用户可以登陆不同后端进行相应的操作。

用户评价:

在线组 数据能够用,但是上传的数据太少
app组 数据现在能用的太少

4、预期目标以及实际情况


预期目标

1.处理数量 60000条 上传数量8000条

2.能够处理pdf、ppt、视频、doc

3.问答网站:搜搜问问、百度知道、德问、cnblogs、stackoverflow、知乎

实际情况

1.实际处理数量 55308条 上传数量240条

2.实际能处理的文件pdf、ppt、小部分视频

3.实际问答网站:搜搜问问、百度知道、德问、cnblogs、stackoverflow

  由于后期时间原因,我们与在线组和app组的交流比较少,导致我们在Json格式定义、测试方面比较缓慢;

视频部分能够处理是因为我们获得的文件不都是特别好,有些是因为视频的相关文本数据太少,所以没法给其

添加标签、关键字等重要搜索关键字。

5、分工协作


  我觉得一个PM在担当总的设计、构建是不太好的,我真心的认为两个规划能力好的同学共同担当效果会更好。

因为我在统筹规划的同时真心地觉得自身能力的不足,无法完美地担任这个职责,所以我觉得至少有一个人监督会更好。

6、平衡 时间/质量/资源


时间
数据库构建 陈谋 5
爬取Tags 陈谋 3
完成txt、html、pdf、ppt、doc(x)、xls(x)等常见文本的挖掘 陈谋 20
完成在线系统的需求分析及解答 马腾跃 5
测试不同问答网站分析的结果 马腾跃 12
UI 李剑锋 8
完成stackoverflow网站的数据挖掘工作 李剑锋 8
完成知乎网站的数据挖掘工作 李剑锋 8
视频链接挖掘 卢惠民 6
测试Tags的正确率、召回率、F值等 卢惠民 14
产品说明书 仉伯龙 8
与爬虫组进行沟通交流分析 仉伯龙 8
完成与手机客户端的需求交流,并实时更新需求 刘夕霆 6
对软件进行详细的功能测试 刘夕霆 16
质量 进行了单元测试
资源 我们人力资源、物力资源都比较充足

7、软件质量


对每一个功能都进行了单元测试,虽然有些测试并非完全覆盖,但是总体来说我们的功能比较完善,而且bug比较少

8、M2阶段的实际进展


9、团队成员在M2的角色和具体贡献


名字

角色

具体的可衡量的可验证的贡献

得分

陈谋

PM & Dev

写了10篇博客,多次和爬虫组、客户端、在线系统进行沟通,写了 3213行代码

90

李剑锋

Dev & Test

写了823行代码,  200行注释, 1篇博客

60

卢惠明

Dev & Test

完成关键词抽取,写了495行代码,并完成相应的测试,2篇博客

40

仉伯龙

Dev & Test

测试了关键词抽取代码,写了235行代码,测试其结果等

37

刘夕霆

Dev & Test

与android客户端组进行沟通,写了276行代码,测试最终版本

35

马腾跃

Dev & Test

写了276行代码,与在线组进行沟通、交流

38

10、成果展示


  • 登陆界面

  • 主界面:

    

  • 添加文本:

  • 原始数据:

  • 去噪:

  • 分词:

  • 翻译原文本:(API)

  • 翻译译文:

  • 中英对照:

  • 最终结果:

  • 上传数据

 

11、软件Bug


  我们的软件管理中遇到的Bug基本上在http://www.cnblogs.com/cheneygroup/p/5117810.html

12、个人总结


    1. 李剑锋:在Beta阶段我们完成了既定的目标,而且我们通过不断沟通,与另外三组一同构建了完整的框架,从而在工作的开展过程中很是愉快。但是由于时间的原因,我们没能够完成既定的目标,这是我们的遗憾!
    2. 陈谋:知识和能力都是在不断地学习和锻炼中累积的,我们在Beta阶段这种高压状态下,仍坚持进行各项任务,我们确实付出了,也确实收获了,感谢软工给予我们不断超越自我的。
    3. 卢惠明:这一阶段我主要负责测试,虽然测试比较枯燥无味,但是确实是一项很有用的技能。
    4. 刘夕霆:软工,我实在不敢恭维。太累了,希望老师减负!。。。不过,我在这几次团队作业中收获了很多很多,谢谢老师。
    5. 仉伯龙:我处理不少事情,但是我感觉学的不是特别多。我相信只要我们不断进取,不断探索,我一定能够学到更多,明白更多,最后在理论知识、实践知识方面有了更高的认识。
    6. 马腾跃:我是这组里唯一的女生,交流起来真的不是特别方便,但是我仍然在尽职尽责地完成PM布置下来的任务,总的来说这阶段我测试任务很多,实质性的开发并不是特别多。

M2 终审的更多相关文章

  1. 各国货币M2增长对比

    自2006至2016年的10年间, 卢布M2增长了3.8倍, 人民币M2增长了3.4倍, 美元M2增长1倍, 欧元/英镑M2增长0.8倍, 日元M2增长0.5倍

  2. M2事后分析报告

    设想和目标 1.我们的软件要解决什么问题?是否定义得很清楚?是否对典型用户和典型场景有清晰的描述? 这次M2预想的就是解决3个主要问题,1:增加查询自己购买或者发布记录的功能,2:优化 所有的网络连接 ...

  3. M1/M2个人总结

    软件工程整个学期结束了,很开心学了这门课,在学到知识的同时也提高了自己的动手实践的能力,感觉自己在整个软件工程的各个环节中都能有所把握,可以将学到的知识运用到设计.实践更多的项目中去. M1阶段个人总 ...

  4. M2事后分析汇报总结

    学霸网站项目Postmortem结果 M2之于M1的改进 文档和问答的整合 完成webservice 完成数据库触发器设计与完整性约束依赖(大规模) 优化学霸UI 资源的搜索 外部问题的搜索 文档的上 ...

  5. sixsix团队“餐站”应用M2阶段发布报告

    一.新功能 客户端 搜索功能 我们在M2中实现了对地点的搜索菜品,可以直接在主页页面中的输入框输入用户喜欢的菜品,系统将返回与对应关键字所对应的选择,更加高效直观的满足客户的口味. 菜品图片加载 我们 ...

  6. maven本地仓库的配置以及如何修改默认.m2仓库位置

    本地仓库是远程仓库的一个缓冲和子集,当你构建Maven项目的时候,首先会从本地仓库查找资源,如果没有,那么Maven会从远程仓库下载到你本地仓库.这样在你下次使用的时候就不需要从远程下载了.如果你所需 ...

  7. M2的来源很简单

     http://bbs.tianya.cn/post-develop-412703-1.shtml M2的来源很简单,一部分是外汇占款,这个是我们国家的缺陷,如果外汇不管制,其实是不会发生增长人民币的 ...

  8. maven本地仓库.m2文件夹路径讲解

    Maven是一个项目管理工具,它包含了一个项目对象模型 (Project Object Model),一组标准集合,一个项目生命周期(Project Lifecycle),一个依赖管理系统(Depen ...

  9. 【转】M0,M1,M2,M3,M4基本概念

    在金融学中的M1,M2,M3,M4都是货币层次的划分M0= 流通中的现金;M1=M0+ 个人信用卡循环信用额度+ 银行借记卡活期存款+ 银行承兑汇票余额+ 企业可开列支票活期存款;M2=M1+ 个人非 ...

随机推荐

  1. OSPF单区域配置

    OSPF单区域配置 实验环境:华为模拟器eNSP 现在有这样一个拓扑图: 我想要让R1可以ping通R3,显然目前是不行的: <R1>ping 192.168.2.2 PING 192.1 ...

  2. 个人技术博客Alpha----Android Studio UI学习

    项目联系 这次的项目我在前端组,负责UI,下面简略讲下学到的内容和使用AS过程中遇到的一些问题及其解决方法. 常见UI控件的使用 1.TextView 在TextView中,首先用android:id ...

  3. vue的组件详解

    什么是组件 组件(Component)是 Vue.js 最强大的功能之一.(好比电脑中的每一个元件(键盘,鼠标,CPU),它是一个具有独立的逻辑和功能或界面,同时又能根据规定的接口规则进行互相融合,变 ...

  4. C#中删除集合中符合条件的元素以及需注意属相

    如果用foreach,会造成被遍历的集合更改后带来异常问题. 此时,用for循环可有效的解决这个问题. for(int i=0;i<List.Count;i++) { if(条件是真) { Li ...

  5. Android Activity学习笔记——Activity的启动和创建

    http://www.cnblogs.com/bastard/archive/2012/04/07/2436262.html 最近学习Android相关知识,感觉仅仅了解Activity几个生命周期函 ...

  6. luogu P5151 HKE与他的小朋友

    嘟嘟嘟 看到\(i\)变成了\(A_i\),我突然想起了置换这个东西.于是马上到网上学了一遍轮换乘法. 手模后发现轮换乘法满足结合律,但不满足交换律. 于是就可以快速幂啦. 需要注意的是每一次相乘是\ ...

  7. go标准库的学习-strconv-字符串转换

    参考:https://studygolang.com/pkgdoc 导入: import "strconv" strconv包实现了基本数据类型和其字符串表示的相互转换. 1)ap ...

  8. day12 Python元祖

    前戏 #元祖:元素不可被改变,不能白增加或者删除 #tuple #tu = (11,22,33,44) #tu.count(22),获取指定元素在元祖中出现的次数 #tu.index(22),获取元素 ...

  9. css3 实现图片等比例放大与缩小

    css3 实现图片等比例放大与缩小 在工作中,经常会碰到图片缩放的情况,比如服务器端返回的图片大小,可能大小不同,有的大,有的小,服务器端返回的图片大小我们不能控制的,但是在我们设计稿的时候,可能会规 ...

  10. 开发板测试-GPRS

    注意事项: 经过测试,为了使STM32和Air202的串口稳定通信,需要更改 以前电路感觉应该是三极管控制极4.7K电阻太大,又因为开关速度快,然后开关的时候导致不足以让三极管处于全部导通状态,所以电 ...