系统运行:文件夹system下,可执行文件ontoEnrichment

概念学习

--------------------------------------------------------1、简单概念学习
语料库配置文件:corpusDir(可自行配置,第一行为领域语料文件所在目录,其他为背景语料文件所在目录,每个目录占一行)
------------程序执行:
请输入语料库配置文件(第一行为领域语料):./corpusDir
请输入经过分词预处理的领域文档存放目录:./语料/domainSegment
请输入输出文件名:./shuchu/simple_concept
请输入简单概念筛选阈值(默认x=0.5,y=1.0),如果未输入则选择默认值:
0.5
1.0

--------程序执行结果:./shuchu/simple_concept

-------------------------------------------------------2、复合概念学习

------------程序执行:
请输入构成复合概念词根文件:./Data/root.txt (可以包含多个,每个词一行)
请输入构成复合概念模板文件(按R学习模板文件):./Data/rule (复合概念词性构成规则)

    若要重新学习复合概念规则
      规则获取文件:./Data/ruleTrainData.txt (每行为一个记录,其格式为:句子 该句中包含的复合概念)
请输入领域文档集合所在目录名:./语料/domainWeapon
是否进行复合概念词频统计进行筛选(Y/N):Y
是否进行上下文依赖筛选(Y/N):Y
请输入上下文依赖筛选阈值(未输入则使用默认值0.5):0.5
通过上下文依赖筛选的复合概念存储在(输入文件名):./shuchu/compoundConcept.txt

--------程序执行结果:

终端输出的结果:【复合概念 上下文依赖值/复合概念在领域文档中出现的频率】

./shuchu/compoundConcept.txt 文件中的内容:【与终端输出的结果差别是:“上下文依赖值/复合概念在领域文档中出现的频率”的值大于上下文依赖筛选阈值才存入输出文件中】

关系学习

   1、使用维基百科信息盒进行关系学习
            2、使用维基百科分类名进行关系学习
            3、使用维基百科链接进行关系学习
            4、使用广义后缀树识别概念分类关系
            5、使用层次聚类学习概念间分类关系
            6、模板匹配法学习特定概念间关系(方法一)
            7、模板匹配法学习特定概念间关系(方法二)

1、前提:并不是wiki文件里面所有的概念都有其对应的infobox这一条目,故不是输入任何概念都可以得到信息盒抽取的概念间的关系

     拥有infobox这一条目的所有概念:./wikiData/infoboxWords.txt ,一个概念一行

----------------程序运行
            ***********************************************
            ****维基百科信息盒(infobox)抽取概念间关系****
            ***********************************************

请输入概念名:航空器
arg1 : ./wikiData/zhwiki-latest-pages-articles.xml
arg2 : ./wikiData/outputConceptPage
total concepts : 1
./scripts/extract_wiki_page.sh ./wikiData/zhwiki-latest-pages-articles.xml ./wikiData/outputConceptPage 航空器
lines : 157
4 of 157 in Infobox.
attributes size :2
航空器 包含如下关系三元组:
SuperClass : aircraft begin

ISA : aircraft begin
caption : 空客A380

caption : 空客A380,人类目前最大的民用固定翼航空器。
image : Image:Airbus A380 blue sky.jpg
name : 航空器
infobox关系抽取完成!
是否继续(Y/N)?

-------------------程序运行结果:

航空器 ISA aircraft
航空器 ISA begin
航空器 caption 空客A380

2、前提:并不是wiki文件里面所有的概念都有其对应的“分类名”这一条目,故不是输入任何概念都可以得到概念关系三元组

     拥有“分类名”这一条目的所有概念:./wikiData/categoryWord.txt ,一个概念一行

----------------------程序运行:

请输入待扩展的概念名:航空器
请输入结果存储文件名:./shuchu/test
是否继续(Y/N)?

-------------------程序运行结果:./shuchu/test中的结果:

3、 程序运行前预处理:

  运行./wikiData/wikiGraph程序【该程序是对wiki的
xml文件进行预处理,得到维基百科连接图文件】,改程序的输入是:./wikiData/wikiNet.txt【wiki百科文件中每个概念的链接关
系】和./wikiData/wikiNetRedict.txt【wiki百科文件中概念的重定向关系】两个文件,最终输出wikiNetGraph文
件(名字可以任意自定)【得到的维基百科连接图文件】,该输出文件作为“维基百科链接抽取相关概念”的相关输入之一。

------------------------程序运行:

   *******************************
            ****维基百科链接抽取相关概念****
            *******************************

请输入维基百科重定向文件,维基百科链接图文件(input 0 to get default config):

> 0            #或者手动输入:  ./wikiData/wikiNetRedirect.txt    ./wikiData/wikiNetGraph   (包含两行记录) 

title and redirects loading ...
Wiki TitleRedirect file opened!
213366 basic titles loaded.
211572 redirect relationship loaded.
2505 redirect_failed inputs.
TitleRedirects file completed 100%
empty wikiGraph created!
begin to read wikiGraph from ./wikiData/wikinetGraph
open wikiGraph success.
ready to deal with 213366 elems wikiGraph
finish dealing with 213366 elems wikiGraph

open (../system/wordVector/)conceptWikiFile Waiting for writing...    
                         
#根据用户输入的概念,程序最终运行得到的概念相关概念向量的结果以追加的方式写入到文件 ./wordVector/conceptWikiFile中
 
wiKnows (q to quit) > 航空器

------------------------------------程序运行结果

终端输出的中间结果:与概念“航空器”相关的所有概念以及相关程度,该值是一个大于0小于1的值,且一般都远小于1

./wordVector/conceptWikiFile文件中追加的结果:从所有相关概念中选择相关度最高的前50个得到的结果

4、          *********************************
          ****广义后缀树构建概念间层次结构****
          **********************************
请输入领域概念文件:./Data/concept(待建立层次关系的概念集合,该文件中每行数据为一个领域概念,此处的输入可以是复合概念学习的输出)
请输入存储文件名:./shuchu/test
press any key to continue!

------------------------------程序运行结果

./shuchu/test中的内容:

5、输入:./wordVector/conceptKeyFile(从自然文本中得到的概念集合的上下文词向量) ./wordVector/conceptWikiFile (通过
模块2从维基百科链接图得到的概念相关概念向量,其具体格式见相应的文件)

-----程序运行时,实际是没有输入选项的

6、训练文件: ./6/train
   模板个数:根据训练文件可以自己调整
   测试文件:./Data/test(格式跟训练文件一样)

7、训练文件: ./7/train
   测试文件:./7/test
---------------程序运行结果

(64位)本体学习程序(ontoEnrich)系统使用说明文档的更多相关文章

  1. (64位)本体学习程序(ontoEnrich)系统配置说明文档

    1系统环境 64位 Ubuntu 2 第三方依赖库配置 boost_1_44_0 #解压boost_1_44_0.tar.gz 到 /usr/local.如果出现权限问题,请用sudo执行该命令 ta ...

  2. (32位)本体学习程序(ontoEnrich)系统配置说明文档

    1.系统环境 32位 Ubuntu 源代码中已经包含在32位下编译生成的.o文件,配置好依赖库(步骤2)后,参考步骤3则可重新link. link无误即可运行程序. 2.依赖库  2.1 boost_ ...

  3. 关于64位 windows&linux双系统引导问题

    换了台本子win7 64位,抽空做个双系统,装了下linux. 遇到开机问题:进linux可以正常使用,进win7花屏死机,初步估计是grub(此时的boot sector位grub)的问题,启动器被 ...

  4. Print2flash在.NET(C#)64位中的使用,即文档在线预览

    转:http://www.cnblogs.com/flowwind/p/3411106.html Print2flash在.NET(C#)中的使用,即文档在线预览   office文档(word,ex ...

  5. OWL库(叙词表构建本体OWL库)程序说明文档

    本体程序(叙词表转化OWL)及相关数据 程序已有资源:

  6. (32位)本体学习程序(ontoEnrich)系统使用说明文档

    系统运行:文件夹system下,可执行文件ontoEnrichment --------------------------------------------------------1.简单概念学习 ...

  7. 在PE32位下安装64位2003、2008系统

    步骤 1.进PE(这里是老毛桃为例) 2.将系统(这里windows2008 r2 为例)拷到本地硬盘 3.将ios镜像出来 4.在PE桌面找到 “windows系统安装”,浏览 系统文件  \sou ...

  8. 树莓派3B+和3B 安装64位debian GUN/Linux系统

    请直接参考如下博客: https://blog.csdn.net/u013451404/article/details/80710136 如果是3B的树莓派用户,只需要把第一个分区boot里的.dtb ...

  9. 【腾讯GAD暑期训练营游戏程序班】游戏中的特效系统作业说明文档

随机推荐

  1. Sqlserver_函数介绍

    SQL2008 表达式:是常量.变量.列或函数等与运算符的任意组合. 1. 字符串函数 函数 名称 参数 示例 说明 ascii(字符串表达式) select ascii('abc') 返回 97 返 ...

  2. 矩阵分解----Cholesky分解

    矩阵分解是将矩阵拆解成多个矩阵的乘积,常见的分解方法有 三角分解法.QR分解法.奇异值分解法.三角分解法是将原方阵分解成一个上三角矩阵和一个下三角矩阵,这种分解方法叫做LU分解法.进一步,如果待分解的 ...

  3. LAYOUT 注意点

    1:CLK时钟GND全包,可以适当调整布局使包地完整. 2:WIFI天线下层均净空GND 3:过孔尽量不打在焊盘上或距离焊盘太近容易漏锡

  4. MAC下搭建Hexo博客

    一.前言 Hexo是一款快速.简洁,基于node.js的强力框架. (1)超快速度:Node.js 所带来的超快生成速度,让上百个页面在几秒内瞬间完成渲染. (2)支持markdown:Hexo 支持 ...

  5. Scrum Meeting day 1

    第一次会议,在这一次的会议中,明确了任务目标,并将任务进行合理分配,并且规划了整个任务的初步计划. No_00:分工情况 姓名 分工   崔强      PM 杜正远 主力工程师 王嘉豪 主力工程师 ...

  6. java实验项目报告

            JAVA课程项目报告   题目:利用java实现一个时钟的小程序 姓名:王国梁 班级:计科13-2 学号:201303011200         利用JAVA实现一个时钟的小程序 1 ...

  7. 『编程题全队』Alpha 阶段冲刺博客Day5

    1.每日站立式会议 1.会议照片 2.昨天已完成的工作统计 孙志威: 1.完成SlotWidget的设计和功能 2.修改了TitleBar上的功能按钮的CSS样式表 孙慧君: 1.登录框的UI设计 2 ...

  8. How to delete deployed process definition in activiti?

    https://community.alfresco.com/thread/219767-how-to-delete-deployed-process

  9. TCP/IP之大明内阁 转

    原创: 刘欣 码农翻身 2016-11-02 本文是<TCP/IP之大明王朝邮差>的前传,  讲一讲大明内阁的各位大人是怎么设计TCP/IP网络的.大明天启年间,  明熹宗朱由校醉心于木工 ...

  10. OneZero第一次站立会议&Sprint Planning Meeting(2016.3.21)

    会议时间:2016年3月21日 11:40~12:00 会议成员:冉华,张敏,王巍,夏一鸣. 会议目的:列举第一周工作内容,确定第一周工作分配.即挑选出一个Story作为本次迭代完成的目标. 会议内容 ...