下午去实验室继续写实验报告,跟伟杰要了一个实验报告,然后大师兄叫我,我们在走廊唠了一会儿。


师兄想做Open
NE,他说这个会比较难,目前没有人做,因为还没有发现相关的文章,大家研究的都是指定了哪种实体之后的识别,这种Open的还不是很成熟,目前的想法就
是挖掘实体结构,然后来确定实体边界。目前想让我在几个现成的实体上试试能不能挖掘出来有效的结构,或者其他有效的方法。

所以今天的任务有这些:

  1. 做实验
  2. 写报告
  3. YY一下OpenNE


上跟家伟吃饭的时候也讨论了一下如果是他,他怎么办,因为他是分析图像的,所以就相当于给几个图片,中间标出主题的轮廓。比如给几个猫的图片和房子的图
片,标出来,然后让他识别车图片和人的图片等其他图片里的内容的轮廓。他说如果是他他会选择强化学习,然后具体怎么样他也没想法。其实和后来在跟师兄讨
论,感觉这个比喻并不恰当。在黑店吃完饭之后我们去实验室楼下一家新开的饮品店喝点咖啡,接到了大师兄的电话,商量了一下最近的情况,因为现在跟少磊坐一
起,所以周一、周二、周三、周日的下午和晚上过来合计合计,尽快拿出个方案。这周六和周日打算做一些自己的调查和分析。然后周一晚上过来跟师兄碰头。


上写完报告之后,师兄给了我一些搜狗细胞词库里面的词,初步感觉上不同种类的命名实体有很大区别,有的可能用最后一个词就能识别的很好了,有的实体就能且
仅能靠词典。所以我现在觉得我们应该大概统计一下,针对单独的NE大家都有哪些办法,然后看是否能进行组合什么的,如果耦合性不是很强,那最好了,那不同
的方法就可以拆开然后重组。这样我们就对新的实体类进行测试,看哪种组合最合适,就用哪种。比
如对于甲类实体,命名实体研究者的方法可以分解为手段A、手段B、手段C,而对乙类实体,研究者的方法可以分解为手段D、手段E、手段F,然后我们把它们
都整合在一起,提纯,对于未知的实体,讲A、B、C、D、E、F这几种手段 进行组合,分别对这种实体进行测试,看哪种组合效果最好,就用哪种。

不过如果每种实体用的方法的耦合都很强的话就得换别的思路了,总的来说现在的工作就两方面:

  1. 看看对于不同的实体都有什么不同的方法。需要看一些论文,综述什么的,找一找感觉。
  2. 然后多看一些词库,看看能不能看出公共的部分,有没有安全通用的方法。

2013.6.21 - OpenNER第一天的更多相关文章

  1. 2013.9.3 - OpenNER第十一天

    下午接受了天猫某高管的交叉面试,在图书馆电面的,感觉面的不怎么好,他先问了我飞天的情况,还有我做了什么,他感觉和我聊不到一起去,我感觉应该是下午在地下铁喝的那杯咖啡让我慌了神,后来他又问了大数组抽取最 ...

  2. 2013/11/21工作随笔-PHP开启多进程

    今天被问到一个问题,php如何开启多进程才比较稳定. php开启多进程执行一个操作有哪些方法: 首先想到的是使用pcntl的fork 具体可以参考之前的文章:PHP的pcntl多进程 其次想到的方法是 ...

  3. Kali Linux 1.0 新手折腾笔记(2013.3.21更新)

    rootoorotor昨天折腾了 Kali Linux 1.0,把大概的配置过程记录下来,希望对想接触或使用Kali Linux的同学有所帮助. 请注意: 1.本文为面向新手的教程,没技术含量,没事瞎 ...

  4. 2013.6.29 - OpenNER第九天

    上午看计算机网络,下午做计算机实验.晚上写计算机实验报告,还有OpenStack的实验报告. 写完之后跟师兄讨论了一下OpenNER的事情,觉得OpenNE很像是化学物质,里面很多都可以构成原子团,原 ...

  5. 2013.4.19 - KDD第一天

    其实昨天KDD就开始了,不过今天算是我跟KDD的第一天.   昨天夜里就短信跟中秋聊了一会儿,然后中秋说他一天都在弄数据库,连不上怒了.然后我跟他说明天我来.于是今天就在图书馆弄KDD,数据是用数据库 ...

  6. Cheatsheet: 2013 07.21 ~ 07.31

    Mobile Android vs. iOS: Comparing the Development Process of the GQueues Mobile Apps Android Studio ...

  7. 2013.6.26 - OpenNER第六天

    今例会的时候看CRF,突然感觉到ANN模型可能没有问题了,问题出在评价函数,不能接过好就说好,或者说收敛方法有问题,并不是打得对就答得好.还有就是我们应该让他能够根据需要而自己产生问题,问我们,然后我 ...

  8. 2013.5.21 - KDD第三十三天

    实验室例会,上到一半之后发现今天下午第二节课是Android,上次两节Android都没跟中秋碰头,这次又不能碰头了,然 后就赶紧给中秋发了个短信,说我在开会,晚上约个时间再谈.正好也称这一下午加一晚 ...

  9. MySQL 5.6 复制:GTID 的优点和限制(第一部分)

    全局事务标示符(Global Transactions Identifier)是MySQL 5.6复制的一个新特性.它为维护特定的复制拓扑结构下服务器的DBA们大幅度改善他们的工作状况提供了多种可能性 ...

随机推荐

  1. Spring MVC -- MVC设计模式(演示4个基于MVC框架的案例)

    对于简单的Java Web项目,我们的项目仅仅包含几个jsp页面,由于项目比较小,我们通常可以通过链接方式进行jsp页面间的跳转. 但是如果是一个中型或者大型的项目,上面那种方式就会带来许多维护困难, ...

  2. C++使用fill初始化二维数组

    类似如下用法: fill(dis[0], dis[0]+maxn*maxn, INF); 因为 dis[0]才是dis的首元素 dis[0][0] 的地址.

  3. Java之使用IDE

    IDE是集成开发环境:Integrated Development Environment的缩写. 使用IDE的好处在于按,可以把编写代码.组织项目.编译.运行.调试等放到一个环境中运行,能极大地提高 ...

  4. AutoResetEvent 学生考试,老师阅卷,学生等待考试结果

    class Program { static void Main(string[] args) { )); t.Start(); Console.WriteLine("老师等待提交试卷&qu ...

  5. Echartjs axis.getAxesOnZeroOf is not a function

    该问题已经解决,下面是解决思路! 问题描述: axis.getAxesOnZeroOf is not a function 使用echart 出现报这句错误,请求解决方案! 问题原因: 我给坐标设置了 ...

  6. vue中指令绑定的v-if逻辑结构

    <!-- if判断 --> <div id="app2"> <p v-if="seen"> <!-- 给p标签绑定指令 ...

  7. JWT黑名单和白名单

    单点登录系统 单点登录系统保存了用户的登录名和密码,上网用户在单点登录系统中认证成功后,就可以直接登录各个业务系统. 1. 用户使用单点登录系统的登录界面,输入用户名和密码登录成功后, 单点登录系统为 ...

  8. Testbench编写技巧

    一.基本架构(常用模板) `timescale 1ns/1ps //时间精度 `define Clock //时钟周期 module my_design_tb; //================= ...

  9. 玩转Spring全家桶笔记 02 那些好用的连接池HikariCP

    1.前言 简单了解一下来自日本的一个新起之秀连接池---HikariCP github:https://github.com/brettwooldridge/HikariCP 2.HikariCP为什 ...

  10. 解决COM组件在WPF设计器中命名空间不存在XXX的问题(附带如何在WPF中使用APlayer引擎)

    总结起来就是:设计器的版本要跟外部引用的库版本一致,否则XAML设计器就会显示不出来. 例如你的程序是X64的,但是引用的COM组件是32位的,就会显示不出来.这里的建议是:编译一个32位的COM中间 ...