1、产品概述

本产品是学霸软件系统的爬虫部分,由NEWBE团队负责。主要任务是从网上爬取出相关数据后提供给C705组使用。

2、产品的发展经历

2.1 产品的发展经历

本产品从2014.10.29开始迭代,经历两轮迭代,发布了ALPHA和BETA版本后。最终基本圆满的满足了C705的需求,并顺利地与学霸下一组成功对接。

2.2 产品的版本

在ALPHA版本阶段,我们的产品方向略有偏移,重点没有放在学霸系统整个的体系下,而是将爬虫作为一个单独的程序而确立产品定位,因此设计了大量UI,URL热度排序,等比较高级,但不实用的功能。

在BETA版本阶段,我们与C705团队进行了充分沟通,明确了我们程序的最重要需求,同时,分析产品定位并找到了关于稳定性、高效性的需求。将产品放回到学霸系统整个的模块下,产品定位更加明确,产品做的也更加实用高效。

3、产品研发规划

3.1 需求列表

1、重要度:重要            需求类型:改进

 需求描述:     限制爬取功能(quiz/pdf/doc/ppt)

2、重要度:重要    需求类型:BUG修改

需求描述:      无法爬取数量巨大的网页,会因为奇怪的bug陷入死锁,解决相应的bug(bug数量可能比较多..多人参与解决..)

3、重要度:重要    需求类型:新增

需求描述:      爬取ppt、doc功能

4、重要度:次重要      需求类型:新增

需求描述:      各个方法写好规格

5、重要度:次重要   需求类型:改进

需求描述:      quiz页面的过滤功能(C705组需求:stackoverflow、百度知道、知乎、搜狗问问、博问、德问)
6、重要度:一般    需求类型:新增

需求描述:存储文件名换成ID号(上版把过长的文件名过滤掉了,需要修改)
7、重要度:一般    需求类型:BUG修改

重复网址会存成两个id不同的数据项.需要修改

8、重要度:一般    需求类型:改进

无关页面过滤算法的优化

9、重要度:较不重要    需求类型:BUG修改

软件开始界面的的newbe logo消失,需要修改

10重要度:重要              需求类型:新增

新增PDF PPT DOC按钮,QUIZ选择列表,可以有针对性的爬取

11重要度:一般      需求类型:改进

饼状图由三种改为可以显示五种。

3.2需求分析

我们的目标用户是C705组,爬取内容供他们使用。因此我们的需求来源于他们对我们内容的要求。因此,在与他们进行多次协商后,我们明确了我们的主要目标任务:

1 在原来爬取类型的基础上,新增可以爬取QUIZ页面的功能。

2 新增PDF PPT DOC按钮,可以针对性的爬取特定内容。

同时,在和他们协商的功能之外,我们知道作为一款长时间运行的网站,爬取软件的稳定程度、效率高低、资源占用多少都非常重要,因此我们修改了诸多BUG,优化了N多算法,以满足稳定、高效的需求。

3.3开发安排

每一天的研发规划都已经记录到DAILY SCRUM中,大家可以去每天的日志中看。

5、产品最终界面

ALPHA版本:

BETA版本:

目前数据库中数据数目:约40w

NEWBE CRALWER 产品需求文档的更多相关文章

  1. 产品需求文档(PRD)的写作方法之笔记一

    1.写前准备(思维导图): http://www.woshipm.com/?p=80070 1.在写之前,请先很区分清楚什么是MRD文档(市场需求文档),BRD文档(商业需求文档),什么是PRD文档( ...

  2. PRD产品需求文档

    什么是PRD? PRD是Product Requirement Document的英文缩写,即产品需求文档的意思.PRD昰产品流程中的最后一步工作,是将原型中的功能.界面具象化描述,是提交给设计(UI ...

  3. [转]产品需求文档(PRD)的写作

    产品需求对产品研发而言非常重要,写不好需求,后面的一切工作流程与活动都会受到影响.转载一篇文章,关于产品需求文档写作方面的,如下: 本文摘自(一个挺棒的医学方面专家):http://www.cnblo ...

  4. PRD产品需求文档概要

    PRD概念 PRM就是Product Requirements Document的简称,也就是产品需求模型.一般来说一个产品会伴随有市场需求文档(Market Requirements Documen ...

  5. 产品需求文档 PRD

    第一轮: 1,文档使用方:UI设计师 2.内容:       根据战略层定义出来产品功能范围,       说明此产品的目的,方便UI设计人员更好的理解产品       产品基本流程       详细 ...

  6. 优质产品需求文档(PRD)写作三大原则

    在上一篇文章中有介绍,产品经理的两项主要职责包括:对产品机会进行评估,以及对开发的产品进行评估.而定义即将开发上线的产品,则需要借助产品需求文档,来进行产品的特征和功能描述.PRD文档的写作会因公司. ...

  7. 产品需求文档(PRD)的写作 【转】

    产品需求文档(PRD)的写作   一.文章的摘要介绍 无论我们做什么事都讲究方式方法,写产品需求文档(以下称PRD文档)也是如此,之前我通过四篇文章分享了自己写PRD文档的一些方法,而这一篇文章主要是 ...

  8. B端产品需求文档怎么写?

    B端,或者2B,一般指的是英文中的 to busniss,中文即面向企业的含义.与B端相对应的,是C端,或者2C,同样指的是英文中的 to customer,即面向消费者的意思.因此,人们平常所说的B ...

  9. 如何写出好的PRD(产品需求文档)(转)

    作者:Cherry,2007年进入腾讯公司,一直从事互联网广告产品管理工作,目前在SNG/效果广告平台部从事效果广告的产品运营工作. PRD(Product Requirement Document, ...

随机推荐

  1. Vim和Vi的常用命令

    Vim 文本编辑器 1.Vim 和 Vi: 两者都是多模式编辑器: Vim 是 Vi 升级版,再兼容 Vi 所有指令的同时增加了一些新功能支持: 特点: 语法加亮:使用不同的颜色加亮代码: 多级撤销: ...

  2. nginx服务器开启缓存、反向代理

    一.反向代理配置 1.反向代理服务器配置如下 反向代理就是需要这一行proxy_pass来完成.当我们要访问后端web服务器的时候,我们只需要访问代理服务器就可以了,此时代理服务器就充当后端web服务 ...

  3. SAP ABAP 查找用户出口

    1.查找事物代码程序名 2.查找用户出口 T-CODE:SE80 在子例程中查找以USEREXIT开头的子程序.

  4. January 12th, 2018 Week 02nd Friday

    Nothing behind me, everything ahead of me, as is ever so on the road. 我的身后空空荡荡,整个世界都在前方,这就是在路上. That ...

  5. 【阿里八八】团队Alpha博客链接目录

    团队Alpha冲刺博客 阿里八八Alpha阶段Scrum(1/12) 阿里八八Alpha阶段Scrum(2/12) 阿里八八Alpha阶段Scrum(3/12) 阿里八八Alpha阶段Scrum(4/ ...

  6. 难点--均方误差(MSE)和均方根误差(RMSE)和平均绝对误差(MAE)

    MSE: Mean Squared Error 均方误差是指参数估计值与参数真值之差平方的期望值; MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度. MSE=1 ...

  7. PHP开发小技巧②—实现二维数组根据key进行排序

    在PHP中内置了很多对数组进行处理的函数,有很多时候我们直接使用其内置函数就能达到我们的需求,得到我们所想要的结果:但是,有的时候我们却不能通过使用内置函数实现我们的要求,这就需要我们自己去编写算法来 ...

  8. iframe获取父、子窗口的元素和方法

    原文地址:https://www.cnblogs.com/BlingSun/p/7484237.html jQuery.js调用iframe父窗口与子窗口元素的方法(亲测有效) 子页面获取父页面的id ...

  9. 转载 线程池之ThreadPool类与辅助线程 - <第二篇>

    http://www.cnblogs.com/kissdodog/archive/2013/03/28/2986026.html 一.CLR线程池 管理线程开销最好的方式: 尽量少的创建线程并且能将线 ...

  10. LoadRunner 11安装Micosoft Visual C++ 2005 SP1时提示命令行选项语法错误

    如果安装LoadRunner 11时弹窗提示"Micosoft Visual C++ 2005 SP1 可再发行组件包(X86):'命令行选项语法错误.键入命令 / ? 可获得帮助信息'&q ...