1、产品概述

本产品是学霸软件系统的爬虫部分,由NEWBE团队负责。主要任务是从网上爬取出相关数据后提供给C705组使用。

2、产品的发展经历

2.1 产品的发展经历

本产品从2014.10.29开始迭代,经历两轮迭代,发布了ALPHA和BETA版本后。最终基本圆满的满足了C705的需求,并顺利地与学霸下一组成功对接。

2.2 产品的版本

在ALPHA版本阶段,我们的产品方向略有偏移,重点没有放在学霸系统整个的体系下,而是将爬虫作为一个单独的程序而确立产品定位,因此设计了大量UI,URL热度排序,等比较高级,但不实用的功能。

在BETA版本阶段,我们与C705团队进行了充分沟通,明确了我们程序的最重要需求,同时,分析产品定位并找到了关于稳定性、高效性的需求。将产品放回到学霸系统整个的模块下,产品定位更加明确,产品做的也更加实用高效。

3、产品研发规划

3.1 需求列表

1、重要度:重要            需求类型:改进

 需求描述:     限制爬取功能(quiz/pdf/doc/ppt)

2、重要度:重要    需求类型:BUG修改

需求描述:      无法爬取数量巨大的网页,会因为奇怪的bug陷入死锁,解决相应的bug(bug数量可能比较多..多人参与解决..)

3、重要度:重要    需求类型:新增

需求描述:      爬取ppt、doc功能

4、重要度:次重要      需求类型:新增

需求描述:      各个方法写好规格

5、重要度:次重要   需求类型:改进

需求描述:      quiz页面的过滤功能(C705组需求:stackoverflow、百度知道、知乎、搜狗问问、博问、德问)
6、重要度:一般    需求类型:新增

需求描述:存储文件名换成ID号(上版把过长的文件名过滤掉了,需要修改)
7、重要度:一般    需求类型:BUG修改

重复网址会存成两个id不同的数据项.需要修改

8、重要度:一般    需求类型:改进

无关页面过滤算法的优化

9、重要度:较不重要    需求类型:BUG修改

软件开始界面的的newbe logo消失,需要修改

10重要度:重要              需求类型:新增

新增PDF PPT DOC按钮,QUIZ选择列表,可以有针对性的爬取

11重要度:一般      需求类型:改进

饼状图由三种改为可以显示五种。

3.2需求分析

我们的目标用户是C705组,爬取内容供他们使用。因此我们的需求来源于他们对我们内容的要求。因此,在与他们进行多次协商后,我们明确了我们的主要目标任务:

1 在原来爬取类型的基础上,新增可以爬取QUIZ页面的功能。

2 新增PDF PPT DOC按钮,可以针对性的爬取特定内容。

同时,在和他们协商的功能之外,我们知道作为一款长时间运行的网站,爬取软件的稳定程度、效率高低、资源占用多少都非常重要,因此我们修改了诸多BUG,优化了N多算法,以满足稳定、高效的需求。

3.3开发安排

每一天的研发规划都已经记录到DAILY SCRUM中,大家可以去每天的日志中看。

5、产品最终界面

ALPHA版本:

BETA版本:

目前数据库中数据数目:约40w

NEWBE CRALWER 产品需求文档的更多相关文章

  1. 产品需求文档(PRD)的写作方法之笔记一

    1.写前准备(思维导图): http://www.woshipm.com/?p=80070 1.在写之前,请先很区分清楚什么是MRD文档(市场需求文档),BRD文档(商业需求文档),什么是PRD文档( ...

  2. PRD产品需求文档

    什么是PRD? PRD是Product Requirement Document的英文缩写,即产品需求文档的意思.PRD昰产品流程中的最后一步工作,是将原型中的功能.界面具象化描述,是提交给设计(UI ...

  3. [转]产品需求文档(PRD)的写作

    产品需求对产品研发而言非常重要,写不好需求,后面的一切工作流程与活动都会受到影响.转载一篇文章,关于产品需求文档写作方面的,如下: 本文摘自(一个挺棒的医学方面专家):http://www.cnblo ...

  4. PRD产品需求文档概要

    PRD概念 PRM就是Product Requirements Document的简称,也就是产品需求模型.一般来说一个产品会伴随有市场需求文档(Market Requirements Documen ...

  5. 产品需求文档 PRD

    第一轮: 1,文档使用方:UI设计师 2.内容:       根据战略层定义出来产品功能范围,       说明此产品的目的,方便UI设计人员更好的理解产品       产品基本流程       详细 ...

  6. 优质产品需求文档(PRD)写作三大原则

    在上一篇文章中有介绍,产品经理的两项主要职责包括:对产品机会进行评估,以及对开发的产品进行评估.而定义即将开发上线的产品,则需要借助产品需求文档,来进行产品的特征和功能描述.PRD文档的写作会因公司. ...

  7. 产品需求文档(PRD)的写作 【转】

    产品需求文档(PRD)的写作   一.文章的摘要介绍 无论我们做什么事都讲究方式方法,写产品需求文档(以下称PRD文档)也是如此,之前我通过四篇文章分享了自己写PRD文档的一些方法,而这一篇文章主要是 ...

  8. B端产品需求文档怎么写?

    B端,或者2B,一般指的是英文中的 to busniss,中文即面向企业的含义.与B端相对应的,是C端,或者2C,同样指的是英文中的 to customer,即面向消费者的意思.因此,人们平常所说的B ...

  9. 如何写出好的PRD(产品需求文档)(转)

    作者:Cherry,2007年进入腾讯公司,一直从事互联网广告产品管理工作,目前在SNG/效果广告平台部从事效果广告的产品运营工作. PRD(Product Requirement Document, ...

随机推荐

  1. Apache的配置详解 带图

    对Apache 的 Http.conf 各项配置详解 1.01 ServerRoot 配置 [ServerRoot "" 主要用于指定 Apache 的安装路径,此选项参数值在安装 ...

  2. The Art of Unit Testing With Examples in .NET

    The Art of Unit Testing With Examples in .NET

  3. Django框架的使用教程--Cookie-Session[五]

    Cookie cookie是存储在浏览器中的一段文本信息,下次同一网站请求,就会发送该cookie给服务器,一般的浏览器都有启动cookie,用cookie存储信息,最好不要存储密码,cookie也有 ...

  4. mysql数据库的test类型

    文章参考自 window系统参考:http://blog.sina.com.cn/s/blog_46f7bb6d0102vde3.html linux 参考:http://www.linuxeye.c ...

  5. 类似Visual Studio一样,使用Qt Creator管理多个项目,创建子项目

    1. 简介 QtCreator是一个十分好用的跨平台IDE,由于最近需要在Windows和Mac同时写一个C++的代码,使用VS和XCode不能实现项目的统一管理(可以使用cmake来组织源码,但是每 ...

  6. java 设计模式之模板方法

    模板方法的定义 定义了一个算法的骨架,并允许子类为一个或多个步骤提供实现. 模板方法使得子类在不改变算法结构的情况下,重新定义某些算法的步骤. 一次性实现一个算法不变的部分,把可变的行为留给子类实现. ...

  7. android 模仿大众点评团购卷列表多余3条时折叠,点击时显示剩余全部的功能

    要实现这样一个效果:加载一组数据,当这组数据的条数超过2条时,则这显示两条,其余的隐藏,当点击“展开全部时”在显示余下的部分.效果如下图所示: 展开前的效果: 展开后的效果 : 实现思路:控制数据而不 ...

  8. linux笔记-多服务器同时执行相同命令

    1.服务器的ip地址写到文件中,命名为nodelist.txt 192.168.1.160 192.168.1.166 2.编写运行脚本 for i in `cat nodelist.txt`do s ...

  9. .NET和F#周报第35周-.NET 8月重大更新

    来看看8月份最后一个周F#和.NET最新相关信息. https://www.yuque.com/rock/fsharp-weekly/35 这次我们多聊聊.NET相关的东西, 看看.NET的健康生态. ...

  10. webpackt入门1:webpack介绍&webpack安装&使用webpack打包

    本篇博客不是原创,简书的zhangwang写的,原文太长,我这里只是提取了一部分. 原文地址:入门webpack,看这篇就够了 一.Webpack解决了什么问题 问题1.JavaScript这个脚本化 ...