系统运行:文件夹system下,可执行文件ontoEnrichment

--------------------------------------------------------1、简单概念学习
语料库配置文件:corpusDir(可自行配置,第一行为领域语料文件所在目录,其他为背景语料文件所在目录,每个目录占一行)
------------程序执行:
请输入语料库配置文件(第一行为领域语料):./corpusDir
请输入经过分词预处理的领域文档存放目录:./语料/domainSegment
请输入输出文件名:./shuchu/simple_concept
请输入简单概念筛选阈值(默认x=0.5,y=1.0),如果未输入则选择默认值:
0.5
1.0

--------程序执行结果:./shuchu/simple_concept

-------------------------------------------------------2、复合概念学习

------------程序执行:
请输入构成复合概念词根文件:./Data/root.txt (可以包含多个,每个词一行)
请输入构成复合概念模板文件(按R学习模板文件):./Data/rule (复合概念词性构成规则)

    若要重新学习复合概念规则
      规则获取文件:./Data/ruleTrainData.txt (每行为一个记录,其格式为:句子 该句中包含的复合概念)
请输入领域文档集合所在目录名:./语料/domainWeapon
是否进行复合概念词频统计进行筛选(Y/N):Y
是否进行上下文依赖筛选(Y/N):Y
请输入上下文依赖筛选阈值(未输入则使用默认值0.5):0.5
通过上下文依赖筛选的复合概念存储在(输入文件名):./shuchu/compoundConcept.txt
--------程序执行结果:./shuchu/compoundConcept.txt

关系学习

    1、使用维基百科信息盒进行关系学习
            2、使用维基百科分类名进行关系学习
            3、使用维基百科链接进行关系学习
            4、使用广义后缀树识别概念分类关系
            5、使用层次聚类学习概念间分类关系
            6、模板匹配法学习特定概念间关系(方法一)
            7、模板匹配法学习特定概念间关系(方法二)

1、输入:概念名(关系三元组中的第一个概念)
            ***********************************************
            ****维基百科信息盒(infobox)抽取概念间关系****
            ***********************************************
请输入概念名:航空器        #并不是wiki文件里面所有的概念都有其对应的infobox这一条目,故不是输入任何东西都可以得到信息盒抽取的概念间的关系
请输入配置文件名(包含维基百科dump文件和抽取出的词条文档存放文件):./wikiConfig   
请输入输出文件名:./shuchu/infoboxhkq
infobox关系抽取完成!
是否继续(Y/N)?

----------------程序运行结果

./shuchu/infoboxhkq里面的内容:

2、输入:概念名(关系三元组中的第一个概念)

3、    *******************************
            ****维基百科链接抽取相关概念****
            *******************************

请输入维基百科重定向文件,维基百科链接图文件:./wikiData/wikiNetRedirect.txt
./wikiData/wikiNetwork   (包含两行记录)
运行结果:

4、输入:./Data/concept(待建立层次关系的概念集合,该文件中每行数据为一个领域概念)
5、输入:./wordVector/conceptKeyFile(从自然文本中得到的概念集合的上下文词向量) ./wordVector/conceptWikiFile (通过
模块2从维基百科链接图得到的概念相关概念向量,其具体格式见相应的文件)

-----程序运行时,实际是没有输入选项的

6、训练文件: ./6/train
   模板个数:根据训练文件可以自己调整
   测试文件:./Data/test(格式跟训练文件一样)

7、训练文件: ./7/train
   测试文件:./7/test
---------------程序运行结果

(32位)本体学习程序(ontoEnrich)系统使用说明文档的更多相关文章

  1. (32位)本体学习程序(ontoEnrich)系统配置说明文档

    1.系统环境 32位 Ubuntu 源代码中已经包含在32位下编译生成的.o文件,配置好依赖库(步骤2)后,参考步骤3则可重新link. link无误即可运行程序. 2.依赖库  2.1 boost_ ...

  2. iOS如何兼容的应用程序32位系统和64Bit系统

    苹果发布iPhone5S时刻,64应用程序位去了眼前.当时我看到苹果公布的官方数据iOS7.x的SDK支撑64位应用程序.而内置的应用程序已经64位置. 我记得自己刚刚接触电脑时还有16位的系统,指针 ...

  3. Dell Venue 8 Pro启动盘UEFI模式32位启动,备份系统

    进入微PE工具箱官方下载页面:http://www.wepe.com.cn/download.html,选择Win8PE 32位 V1.2版下载. 或者直接百度盘下载:https://pan.baid ...

  4. openssh 在32位、64位操作系统上的安装配置

    openssh是安装在windows系统上的提供SSH服务的服务端软件,可以提供安全的命令行远程连接管理.下面介绍下openssh成功安装使用的操作步骤. 工具/原料   openssh window ...

  5. (64位)本体学习程序(ontoEnrich)系统使用说明文档

    系统运行:文件夹system下,可执行文件ontoEnrichment 概念学习 --------------------------------------------------------1.简 ...

  6. (64位)本体学习程序(ontoEnrich)系统配置说明文档

    1系统环境 64位 Ubuntu 2 第三方依赖库配置 boost_1_44_0 #解压boost_1_44_0.tar.gz 到 /usr/local.如果出现权限问题,请用sudo执行该命令 ta ...

  7. OWL库(叙词表构建本体OWL库)程序说明文档

    本体程序(叙词表转化OWL)及相关数据 程序已有资源:

  8. 【腾讯GAD暑期训练营游戏程序班】游戏中的特效系统作业说明文档

  9. 【腾讯GAD暑期训练营游戏程序班】游戏中的物理系统作业说明文档

    一.需求分析• 添加一辆新NPC车,可以让其与主角车碰撞:• 添加一些新物件,能够与车互动,在其触发事件将其移除:• 添加一些无法撞动的事件:• 添加NPC车的自动移动逻辑:• 在课上赛车的示例上添加 ...

随机推荐

  1. Salesforce随笔: 解决被指定给Chatter相关用户的RecordType无法被删除的问题

    被指定给以下三组用户的RecordType无法在对应的Profile里取消占用: Chatter External User Chatter Free User Chatter Moderator U ...

  2. 接口自动化学习--testNG

    一个月一更的节奏~ testNg是一个开源的自动化测试框架..具体那些什么特点的就不想打了- -,贴张图(虽然也看不懂): 学习网站:https://www.yiibai.com/testng 一样是 ...

  3. nodejs mongodb 查询要看的文章

    http://www.cnblogs.com/refactor/archive/2012/07/30/2591344.html 数组很大多数情况下可以这样理解:每一个元素都是整个键的值. db.use ...

  4. hive orc压缩数据异常java.lang.ClassCastException: org.apache.hadoop.io.Text cannot be cast to org.apache.hadoop.hive.ql.io.orc.OrcSerde$OrcSerdeRow

    hive表在创建时候指定存储格式 STORED AS ORC tblproperties ('orc.compress'='SNAPPY'); 当insert数据到表时抛出异常 Caused by: ...

  5. 《LINUX内核设计与实现》第五章学习总结

    一.与内核通信 系统调用:用户控件进程和硬件设备之间添加了一个中间层 系统调用的三个主要作用: 为用户空间提供了一种硬件的抽象接口 系统调用保证了系统的稳定和安全 每个进程都运行在虚拟系统中,而在用户 ...

  6. 《Linux内核设计与实现》Chapter 2 读书笔记

    <Linux内核设计与实现>Chapter 2 读书笔记 一.获取内核源码 1.使用Git 我们曾经在以前的学习中使用过Git方法 $ git clone git://git.kernel ...

  7. 2013337朱荟潼 Linux第三章读书笔记——进程管理

    第三章 进程管理 总结 fork创造的子进程复制了父进程资源,包括内存及进程描述符的内容,资源的复制而不是指针的复制. vfork的行为更像一个线程(指没有自已独立的内存空间),更明显的是vfork的 ...

  8. linux 远程连接报错 10038或者10061 或者10060

    1.检查linux的mysql是否开启 2.检查mysql的user表的host是否是% 3.检查my.cnf文件是否绑定本地 4.防火墙3306端口是否开启 假如以上都没问题,那最大的原因就是我折腾 ...

  9. Daily Scrum - 11/16

    时间:午饭 今天小组例会主要是汇报了各自的进度.任烁那边主要为工程添加了单词的类(包含各个参数等成员变量),方便以后实现算法:拜重阳实现了一个简易的“点进-点出”UI,可谓迈出了艰难的第一步:章玮和罗 ...

  10. Alpha版本冲刺(十)

    目录 组员情况 组员1(组长):胡绪佩 组员2:胡青元 组员3:庄卉 组员4:家灿 组员5:凯琳 组员6:翟丹丹 组员7:何家伟 组员8:政演 组员9:黄鸿杰 组员10:刘一好 组员11:何宇恒 展示 ...