Pipeline组Alpha版本发布说明
Pipeline组Alpha版本发布说明
|
项目名称 |
Pipeline |
|
项目版本 |
Alpha版本 |
|
负责人 |
北京航空航天大学计算机学院 ILoveSE |
|
联系方式 |
http://www.cnblogs.com/ ILoveSE |
|
要求发布日期 |
2013-11-20 |



1 更新内容
1.1 修复缺陷
1)数据库重复输入
2)中文分词算法改进
3)Tf-idf关键词算法改进
1.2 新增功能
1)英文分词算法
2)用户手动插入信息
2 环境要求
|
操作系统需求 |
Windows操作系统 |
|
运行环境需求 |
无 |
|
数据库需求 |
需配置数据库到Windows(或Windows server)数据源中,数据库名为crawler |
3 安装说明
直接解压安装,在Pipeline\Pipeline\bin \Debug文件夹中找到Pipeline.exe可以打开程序。
4 使用说明
UI组在制作提问与解答模块时需要用到我们放在服务器中的数据库。我们的数据库中的数据表共有四张。
|
表名 |
WebPage表 |
WebPage_Tags表 |
Tags表 |
Sensitive_Words表 |
|
作用 |
存有每个网页的具体属性信息。 |
网页号,标签号,还有每个网页对应标签的对应信息。 |
具体每个标签的属性信息。 |
是每个敏感词的属性信息。 |
主要功能有输入用户自己的新信息,根据提供的网页分词和提取关键词还有对应的摘要。主要的几个操作界面有Rawdata:原始信息,Denoisingdata:降噪后信息,WordSegment:分词后结果,FinalData:关键词和对应摘要,Input New Content:用户自主输入信息。
其他的操作都在按钮上面写的很清楚。
5 已知缺陷和限制
中文分词用朴素贝叶斯算法效果较差;
关键词和对应的preview命中率较低;
由于一些英文网页需要进行机器翻译,联网的速度较慢,限制了改进后的效果。
6 发布地址
该版本代码发布在服务器上,可自行下载试用。
————edited by 杨军
Pipeline组Alpha版本发布说明的更多相关文章
- Pipeline组Beta版本发布说明
项目名称 Pipeline 项目版本 Beta版本 负责人 北京航空航天大学计算机学院 IloveSE 小组 联系方式 http://www.cnblogs.com/IloveSE 要求发布日期 20 ...
- Alpha版本发布
Alpha版本发布 Part1.基本介绍 作业所属课程 课程链接 作业要求 要求链接 团队名称 Typhoon 作业目标 通过本次团队项目,体验通过使用软件工程来研发项目的 ...
- GP工作室—Alpha版本发布2
GP工作室-Alpha版本发布2 一.简介 1.1作业要求 这个作业属于哪个课程 https://edu.cnblogs.com/campus/xnsy/GeographicInformationSc ...
- 评论alpha版本发布
讲解顺序: 1. 新蜂:俄罗斯方块 俄罗斯方块已经完成了核心的游戏部分,可以流畅的进行游戏,经验值功能也已经完成,目前进度很好:不足之处主要有:后续的显示内容还没完成,所以界面空出来很多板块,alp ...
- 英语词典Alpha版本发布说明
Alpha版本发布说明 功能: ·简洁的应用界面,不被无良的广告弹窗影响 ·功能直接,在需要查词时及时出现,没有每日一句精选文章等杀了你的流量,在学习过程中更加专注! ·采用金山词霸API,提供发音 ...
- Alpha版本发布时间安排
Alpha版本发布截止时间:2014年11月23日 第一轮迭代M1报告时间:2014年11月27日课上 - 每个团队5分钟时间汇报,5分钟时间提问 第一轮迭代M1事后分析报告时间:2014年11月29 ...
- GP工作室—Alpha版本发布1
目录 GP工作室-Alpha版本发布1 一.简介 1.1作业要求 1.2团队成员 二.软件下载安装说明 五.项目总结 @(Gold Point团队の项目计划) GP工作室-Alpha版本发布1 一.简 ...
- play ball小游戏-Alpha版本发布说明
Alpha版本发布说明 一.功能介绍 本团队所做的微信小程序是一款小球经碰撞后最终到达目的位置通关的休闲益智类游戏.Alpha版本具有的功能大体如下: 1. 闯关模式 多达12关普通竖屏关卡.4关特殊 ...
- Visual Lab Online —— Alpha版本发布声明
Visual Lab Online -- Alpha版本发布声明 项目 内容 班级:北航2020春软件工程 博客园班级博客 作业:Alpha阶段发布声明 发布声明 目录 Visual Lab Onli ...
随机推荐
- vue的监听键盘事件的快捷方法
在我们的项目经常需要监听一些键盘事件来触发程序的执行,而Vue中允许在监听的时候添加关键修饰符: <input v-on:keyup.13="submit"> 对于一些 ...
- python 视频配音、剪辑
一.FFmpeg的使用 首先下载FFmpeg然后将FFmpeg添加到环境路径中.运行cmd 输入ffmpeg无报错表示成功. 二.python中的使用 在python中执行cmd命令需要调用subpr ...
- HTML 5 audio标签
audio标签的介绍 定义: <audio> 标签定义声音,比如音乐或其他音频流. <audio></audio>是HTML5中的新标签 能够在浏览器中播放音频, ...
- Python文本和字符串常用操作
## 字符串分割 line = "This is my love!" fields = line.split(' ') print(fields) # ['This', 'is', ...
- 面试题——Java虚拟机
一.运行时数据区域 Java虚拟机在执行Java程序的时候会把它所管理的内存划分为若干个不同的数据区域,这些区域各有用途: 程序计数器:(线程私有的) 程序计数器是一块较小的内存,可以看作是当前线程所 ...
- JPMML解析PMML模型并导入数据进行分析生成结果
JPMML解析Random Forest模型并使用其预测分析 导入Jar包 maven 的pom.xml文件中添加jpmml的依赖 <dependency> <groupId> ...
- fake_useragent 封装好user-agent的模块
from fake_useragent import UserAgent useragent = UserAgent()print(useragent.random)
- django创建第一个视图-4
创建视图 打开 demo 应用下的 views.py 文件,添加代码 from django.http import HttpResponse from django.shortcuts import ...
- python三大神器之装饰器
装饰器的形成过程 假如你要写一个计算函数执行时间的函数,代码如下: import time def func1(): print('in func1') def timer(func): def in ...
- URL和报文知识总结 ——1
第一部分:浏览器生成的消息 关键词:URL的解析 HTTP请求的生成 DNS服务器 1.URL(网址)的构成: 对于一个网址的解析: https://i.cnblogs.com/index.htm ...