NEWBE CRALWER 产品需求文档
1、产品概述
本产品是学霸软件系统的爬虫部分,由NEWBE团队负责。主要任务是从网上爬取出相关数据后提供给C705组使用。
2、产品的发展经历
2.1 产品的发展经历
本产品从2014.10.29开始迭代,经历两轮迭代,发布了ALPHA和BETA版本后。最终基本圆满的满足了C705的需求,并顺利地与学霸下一组成功对接。
2.2 产品的版本
在ALPHA版本阶段,我们的产品方向略有偏移,重点没有放在学霸系统整个的体系下,而是将爬虫作为一个单独的程序而确立产品定位,因此设计了大量UI,URL热度排序,等比较高级,但不实用的功能。
在BETA版本阶段,我们与C705团队进行了充分沟通,明确了我们程序的最重要需求,同时,分析产品定位并找到了关于稳定性、高效性的需求。将产品放回到学霸系统整个的模块下,产品定位更加明确,产品做的也更加实用高效。
3、产品研发规划
3.1 需求列表
1、重要度:重要 需求类型:改进
需求描述: 限制爬取功能(quiz/pdf/doc/ppt)
2、重要度:重要 需求类型:BUG修改
需求描述: 无法爬取数量巨大的网页,会因为奇怪的bug陷入死锁,解决相应的bug(bug数量可能比较多..多人参与解决..)
3、重要度:重要 需求类型:新增
需求描述: 爬取ppt、doc功能
4、重要度:次重要 需求类型:新增
需求描述: 各个方法写好规格
5、重要度:次重要 需求类型:改进
需求描述: quiz页面的过滤功能(C705组需求:stackoverflow、百度知道、知乎、搜狗问问、博问、德问)
6、重要度:一般 需求类型:新增
需求描述:存储文件名换成ID号(上版把过长的文件名过滤掉了,需要修改)
7、重要度:一般 需求类型:BUG修改
重复网址会存成两个id不同的数据项.需要修改
8、重要度:一般 需求类型:改进
无关页面过滤算法的优化
9、重要度:较不重要 需求类型:BUG修改
软件开始界面的的newbe logo消失,需要修改
10重要度:重要 需求类型:新增
新增PDF PPT DOC按钮,QUIZ选择列表,可以有针对性的爬取
11重要度:一般 需求类型:改进
饼状图由三种改为可以显示五种。
3.2需求分析
我们的目标用户是C705组,爬取内容供他们使用。因此我们的需求来源于他们对我们内容的要求。因此,在与他们进行多次协商后,我们明确了我们的主要目标任务:
1 在原来爬取类型的基础上,新增可以爬取QUIZ页面的功能。
2 新增PDF PPT DOC按钮,可以针对性的爬取特定内容。
同时,在和他们协商的功能之外,我们知道作为一款长时间运行的网站,爬取软件的稳定程度、效率高低、资源占用多少都非常重要,因此我们修改了诸多BUG,优化了N多算法,以满足稳定、高效的需求。
3.3开发安排
每一天的研发规划都已经记录到DAILY SCRUM中,大家可以去每天的日志中看。
5、产品最终界面
ALPHA版本:



BETA版本:


目前数据库中数据数目:约40w

NEWBE CRALWER 产品需求文档的更多相关文章
- 产品需求文档(PRD)的写作方法之笔记一
1.写前准备(思维导图): http://www.woshipm.com/?p=80070 1.在写之前,请先很区分清楚什么是MRD文档(市场需求文档),BRD文档(商业需求文档),什么是PRD文档( ...
- PRD产品需求文档
什么是PRD? PRD是Product Requirement Document的英文缩写,即产品需求文档的意思.PRD昰产品流程中的最后一步工作,是将原型中的功能.界面具象化描述,是提交给设计(UI ...
- [转]产品需求文档(PRD)的写作
产品需求对产品研发而言非常重要,写不好需求,后面的一切工作流程与活动都会受到影响.转载一篇文章,关于产品需求文档写作方面的,如下: 本文摘自(一个挺棒的医学方面专家):http://www.cnblo ...
- PRD产品需求文档概要
PRD概念 PRM就是Product Requirements Document的简称,也就是产品需求模型.一般来说一个产品会伴随有市场需求文档(Market Requirements Documen ...
- 产品需求文档 PRD
第一轮: 1,文档使用方:UI设计师 2.内容: 根据战略层定义出来产品功能范围, 说明此产品的目的,方便UI设计人员更好的理解产品 产品基本流程 详细 ...
- 优质产品需求文档(PRD)写作三大原则
在上一篇文章中有介绍,产品经理的两项主要职责包括:对产品机会进行评估,以及对开发的产品进行评估.而定义即将开发上线的产品,则需要借助产品需求文档,来进行产品的特征和功能描述.PRD文档的写作会因公司. ...
- 产品需求文档(PRD)的写作 【转】
产品需求文档(PRD)的写作 一.文章的摘要介绍 无论我们做什么事都讲究方式方法,写产品需求文档(以下称PRD文档)也是如此,之前我通过四篇文章分享了自己写PRD文档的一些方法,而这一篇文章主要是 ...
- B端产品需求文档怎么写?
B端,或者2B,一般指的是英文中的 to busniss,中文即面向企业的含义.与B端相对应的,是C端,或者2C,同样指的是英文中的 to customer,即面向消费者的意思.因此,人们平常所说的B ...
- 如何写出好的PRD(产品需求文档)(转)
作者:Cherry,2007年进入腾讯公司,一直从事互联网广告产品管理工作,目前在SNG/效果广告平台部从事效果广告的产品运营工作. PRD(Product Requirement Document, ...
随机推荐
- Django学习---笔记一
一. 新建虚拟机在虚拟中完成项目 1.新建虚拟机 mkvirtalenv 虚拟机名称 2.进入虚拟机 cd 新建的虚拟机名称 3.安装Django pip install django 4.Dj ...
- 团队Alpha博客链接目录
Dipper团队Alpha博客链接目录 团队Alpha冲刺博客 第一次冲刺 第二次冲刺 第三次冲刺 第四次冲刺 第五次冲刺 第六次冲刺 第七次冲刺 第八次冲刺 第九次冲刺 第十次冲刺 第十一次冲刺 第 ...
- Java设计模式之五 ----- 外观模式和装饰器模式
前言 在上一篇中我们学习了结构型模式的适配器模式和桥接模式.本篇则来学习下结构型模式的外观模式和装饰器模式. 外观模式 简介 外观模式隐藏系统的复杂性,并向客户端提供了一个客户端可以访问系统的接口.这 ...
- Spring Boot中Web应用的统一异常处理
我们在做Web应用的时候,请求处理过程中发生错误是非常常见的情况.Spring Boot提供了一个默认的映射:/error,当处理中抛出异常之后,会转到该请求中处理,并且该请求有一个全局的错误页面用来 ...
- JS面向对象之工厂模式
js面向对象 什么是对象 "无序属性的集合,其属性可以包括基本值.对象或者函数",对象是一组没有特定顺序的的值.对象的没个属性或方法都有一个俄名字,每个名字都映射到一个值. 简单来 ...
- 每周一个linux命令之---uptime详解
每周一个linux命令之---uptime详解 linux命令 uptime详解 引言:从今天开始,每周更新一个对程序员有用的linux命令,我真的没敢写每天一个,我怕我坚持不下去,每周一个还是可以的 ...
- QT 11 鼠标键盘事件添加
鼠标事件 void mousePressEvent(QMouseEvent *event); //单击 void mouseReleaseEvent(QMouseEvent *event); //释放 ...
- Scrapy对接Splash基础知识学习
一:什么是Splash Splash是一个 JavaScript渲染服务,是一个带有 HTTPAPI 的轻量级浏览器 1 功能介绍 利用 Splash,我们可以实现如下功能: 口异步方式处理多个网页渲 ...
- tomcat运行超时问题解决
之前一直懒得记录,不过最近觉得还是记录一下好一些. 由于项目过于庞大启动时间比较长,而tomcat默认超时时间为45秒,很显然对于一个庞大的项目而言是远远不够的. 错误信息如下所示: Server T ...
- 1896 互不侵犯 洛谷 luogu
题目描述 在N×N的棋盘里面放K个国王,使他们互不攻击,共有多少种摆放方案.国王能攻击到它上下左右,以及左上左下右上右下八个方向上附近的各一个格子,共8个格子. 注:数据有加强(2018/4/25) ...