[IR] Concept Search and LSI

【[IR] Concept Search and LSI】的更多相关文章

[IR] Concept Search and LSI

基于术语关系的贝叶斯网络信息检索模型扩展研究 LSI 阅读笔记背景知识提出一种改进的共现频率法,利用该方法挖掘了索引术语之间的相关关系,将这种相关关系引入信念网络模型,提出了一个具有两层术语节点的扩展信念网络模型,利用实验验证了模型的性能. 将查询术语同义词作为查询证据引入信念网络模型,提出了组合同义词证据的信念网络检索模型,实验验证了模型性能. 利用同义词方法挖掘了简单贝叶斯网络检索模型(SBN 模型)中术语之间的关系,提出了利用这种关系所产生的扩展 SBN 模型,并验证了模型的性能. 利…

[IR] Concept Search and LDA

重要的是通过实践更深入地了解贝叶斯思想,先浅浅地了解下LDA. From: http://blog.csdn.net/huagong_adu/article/details/7937616/ 传统方法的缺陷: 传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的. 在主题模型中,主题表示一个概念.一个方面,表现为一系列相关的单词,是这些单词的条件概率.形象来说,主题…

[Bayes] Concept Search and LSI

基于术语关系的贝叶斯网络信息检索模型扩展研究 LSI 阅读笔记背景知识提出一种改进的共现频率法,利用该方法挖掘了索引术语之间的相关关系,将这种相关关系引入信念网络模型,提出了一个具有两层术语节点的扩展信念网络模型,利用实验验证了模型的性能. 将查询术语同义词作为查询证据引入信念网络模型,提出了组合同义词证据的信念网络检索模型,实验验证了模型性能. 利用同义词方法挖掘了简单贝叶斯网络检索模型(SBN 模型)中术语之间的关系,提出了利用这种关系所产生的扩展 SBN 模型,并验证了模型的性能. 利…

[IR] Concept Search and PLSA

[Topic Model]主题模型之概率潜在语义分析(Probabilistic Latent Semantic Analysis) 感觉LDA在实践中的优势其实不大,学好pLSA才是重点阅读笔记 PLSI 2008年的时候,pLSA已经被新兴的LDA掩盖了. LDA是pLSA的generalization:LDA的hyperparameter设为特定值的时候,就specialize成pLSA了. 从工程应用价值的角度看,这个数学方法的generalization,允许我们用一个训练好的模型解…

[Bayes] Concept Search and LDA

重要的是通过实践更深入地了解贝叶斯思想,先浅浅地了解下LDA. 相关数学知识 LDA-math-MCMC 和 Gibbs Sampling LDA-math - 认识 Beta/Dirichlet 分布 LDA-math - 神奇的 Gamma 函数 LDA学习心得(一)——Gamma函数与Beta/Dirichlet分布 LDA学习心得(二)——文本建模非常好!https://arxiv.org/pdf/1908.03142.pdf[LDA精讲] From: http://blog.csdn…

[Bayes] Concept Search and PLSA

[Topic Model]主题模型之概率潜在语义分析(Probabilistic Latent Semantic Analysis) 感觉LDA在实践中的优势其实不大,学好pLSA才是重点阅读笔记 PLSI 2008年的时候,pLSA已经被新兴的LDA掩盖了. LDA是pLSA的generalization:LDA的hyperparameter设为特定值的时候,就specialize成pLSA了. 从工程应用价值的角度看,这个数学方法的generalization,允许我们用一个训练好的模型解…

本人AI知识体系导航 - AI menu

Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯徐亦达老板 Dirichlet Process 学习目标:Dirichlet Process, HDP, HDP-HMM, IBP, CRM Alex Kendall Geometry and Uncertainty in Deep Learning for Computer Vision 语义分割 colah's blog Feature Visu…

[BOOK] Applied Math and Machine Learning Basics

<Deep Learning> Ian Goodfellow Yoshua Bengio Aaron Courvill 关于此书Part One重难点的个人阅读笔记. 2.7 Eigendecomposition we decompose a matrix into a set of eigenvectors and eigenvalues. 特征值与特征向量: 应用非常广泛: 图像处理中的PCA方法,选取特征值最高的k个特征向量来表示一个矩阵,从而达到降维分析+特征显示的方法, 还有图像压缩…

[Bayesian] “我是bayesian我怕谁”系列 - Naive Bayes+prior

先明确一些潜规则: 机器学习是个collection or set of models,一切实践性强的模型都会被归纳到这个领域,没有严格的定义,’有用‘可能就是唯一的共性. 机器学习大概分为三个领域: 一般的机器学习模型:没有掺杂太多统计概念,例如决策树,KNN聚类,感知机等. 统计机器学习模型:依赖统计理论,主要是贝叶斯统计,例如SVM,naive bayesian,贝叶斯线性回归,高斯过程等. 神经网络模型:可以简单的理解为感知机的扩展,因为扩展的太猛,单独成立门派咯. 如此定义,有助于菜鸡…

[Bayesian] “我是bayesian我怕谁”系列 - Naive Bayes with Prior

先明确一些潜规则: 机器学习是个collection or set of models,一切实践性强的模型都会被归纳到这个领域,没有严格的定义,’有用‘可能就是唯一的共性. 机器学习大概分为三个领域: 一般的机器学习模型:没有掺杂太多统计概念,例如决策树,KNN聚类,感知机等. 统计机器学习模型:依赖统计理论,主要是贝叶斯统计,例如SVM,naive bayesian,贝叶斯线性回归,高斯过程等. 神经网络模型:可以简单的理解为感知机的扩展,因为扩展的太猛,单独成立门派咯. 如此定义,有助于菜鸡…

[AI] 深度数学 - Bayes

数学似宇宙,韭菜只关心其中实用的部分. scikit-learn (sklearn) 官方文档中文版 scikit-learn Machine Learning in Python 一个新颖的online图书资源集,非常棒. 机器学习原理 Bayesian Machine Learning 9. [Bayesian] “我是bayesian我怕谁”系列 - Gaussian Process[ignore] 随机过程 [Scikit-learn] 1.1 Generalized Linear Mo…

[Distributed ML] Yi WANG's talk

王益,分布式机器学习的践行者,他的足迹值得后来者学习. 膜拜策略: LinkedIn高级分析师王益:大数据时代的理想主义和现实主义(图灵访谈)[心路历程] 分布式机器学习的故事-王益[历史由来] 分布式机器学习系列讲座(王益)[油管视频] 腾讯孔雀系统一.基本状况 2014年业内现状并且很多研究员也并不擅长设计适合于自己研发的算法的并行计算架构业内实际问题同时也和腾讯的同事们一起为国际数据挖掘大赛出题,比如KDD Cup 2012和ICME Grand Challenge 2014. 业…

常用PC服务器LSI阵列卡配置

通常,我们使用的DELL/HP/IBM三家的机架式PC级服务器阵列卡是从LSI的卡OEM出来的,DELL和IBM两家的阵列卡原生程度较高,没有做太多封装,可以用原厂提供的阵列卡管理工具进行监控:而HP的阵列卡一般都做过封装了,因此需要使用自身特有的管理工具来监控. 本文以几种常用的阵列卡为例,展示其阵列卡及硬盘监控的方法. DELL SAS 6/iR卡,全称LSI Logic SAS1068E,只支持RAID 0, RAID 1, RAID 1+0, 不支持RAID 5等高级RAID特性,不支持…

Information retrieval信息检索

https://en.wikipedia.org/wiki/Information_retrieval 信息检索 (一种信息技术) 信息检索(Information Retrieval)是指信息按一定的方式组织起来, 并根据信息用户的需要找出有关的信息的过程和技术.狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek).一般情况下,信息检索指的就是广义的信息检索. 信息…

Odoo 8.0 new API 之Environment

""" An environment wraps data for ORM records: - :attr:`cr`, the current database cursor; - :attr:`uid`, the current user id; - :attr:`context`, the current context dictionary. It also provides access to the registry, a cache for records, a…

OpenERP在哪储存附件？

我们知道对OpenERP中的每个内部对象(比如:业务伙伴,采购订单,销售订单,发货单,等等)我们都可以添加任意的附件,如图片,文档,视频等.那么这些附件在OpenERP内部是如何管理的呢? 默认情况下,这些附件在OpenERP v7中是保存在数据库中的.我们知道当附件的数量比较大时,这会严重影响数据库的性能.其实在OpenERP 中我们可以通过设置ir.config.parameter参数来使附件保存在文件系统中,具体菜单位置是:”设置-技术-参数-系统参数-ir_attachement.loc…

(30)odoo中的快捷标签

* 快捷标签提供快捷标签是为了简化代码的编码,把复杂的工作封装化 * 找到封装化的源码: openerp/tools/convert.py xml_import self._tags = { 'record': self._tag_record, 'delete': self._tag_delete, 'function': self._tag_function, 'menuitem…

(08)odoo继承机制

* 全局的引用所有的的模型定义外,都在注册中心注册了,我们可以用全局变量来引用这些模型 self.env[mode name] 比如得到合作伙伴这个模型 self.evn['res.partner'] * 三种常用继承 (在model中操作) _inherit 没重定义_name 这样数据库不会新建对象表,用被继承的表 _inherit 重定义_name 这样数据库会创建新的对象表存储 _inherits 是复合继承,有模型对象,有字段对象 …

openerp 常见问题 OpenERP在哪储存附件？（转载）

OpenERP在哪储存附件? 原文地址:http://cn.openerp.cn/where_to_store_attachement_in_openerp_7/ 我们知道对OpenERP中的每个内部对象(比如:业务伙伴,采购订单,销售订单,发货单,等等)我们都可以添加任意的附件,如图片,文档,视频等.那么这些附件在OpenERP内部是如何管理的呢? 默认情况下,这些附件在OpenERP v7中是保存在数据库中的.我们知道当附件的数量比较大时,这会严重影响数据库的性能.其实在OpenERP 中我…

odoo开发笔记 -- 多对多字段追加数据

正常赋值操作: (以某个模型对象的附件为例) , , attach_ids)] 其中,attach_ids为附件对象id列表. 追加更新操作: 直接追加方式,没有找到;间接实现,每次更新前,去查询附件模型中res_model和res_id; 例如: for dec_obj_id in xxx.xx你的模型对象_id_list: = self.env['ir.attachment'].search([('res_model', '=', 'xxx.xx你的模型名'), ('res_id', '='…

odoo打包下载

view 视图中下载按钮的编辑 <record id="action_download_zip" model="ir.actions.server"> <field name="name">附件打包下载</field> <field name="model_id" ref="model_activity_event"/> <field name=&quo…

Openerp 7.0 附件存储位置

我们知道对OpenERP中的每个内部对象(比如:业务伙伴,采购订单,销售订单,发货单,等等)我们都可以添加任意的附件,如图片,文档,视频等.那么这些附件在OpenERP内部是如何管理的呢? 默认情况下,这些附件在OpenERP v7中是保存在数据库中的.我们知道当附件的数量比较大时,这会严重影响数据库的性能.其实在OpenERP 中我们可以通过设置ir.config.parameter参数来使附件保存在文件系统中,具体菜单位置是: ”设置-技术-参数-系统参数-ir_attachement.lo…

Allocation Sinking Optimization

LuaJIT Sponsorship Program http://luajit.org/sponsors.html Sponsorship for allocation/store sinking A corporate sponsor, who wishes to remain anonymous, has sponsored the development of allocation sinking and store sinking optimizations for LuaJIT in…