信息检索:

信息检索原理是,将书写不规范的原始数据先存储,再通过归纳化or标准化手段进行拆分,便于用户搜索。

信息检索类型可依据数据内容进行分类,文献检索是通过输入关键字进入搜索引擎,搜索仅找到含有关键字符的文字,最后选择哪些文献由学者本身确定。数据检索是在相应数据库中直接找到准确数据,该检索的结果是数值。事实检索是在百科全书数据库中进行找寻事实记录,eg历史依据。

检索工具主要是网络数据库eg:yandex.com

检索方法的选择基于研究者自身需要。基于时间序列,需要了解某学科的发展历史,可以使用顺查法。因为新兴学科(eg区块链)前期的记录非常少,所以采用倒查法。了解某时期内学科发展,可使用抽查法抽取某一时段。追溯法是由文章主要内容到文章参考文献A,再由A找到A的参考文献B,现在文献数据库可以找到2层。循环法是综合以上方法。

检索途径分为外部途径和内部途径。

外部途径就是基于字面意思表达,单纯进行字符串匹配得到的结果。其中,题名限制是找title中含有关键字的文献,特别的是Title限制与topic限制不同,基于topic限制时,字符串搜索区域是title+abstract+keyword。责任者途径是基于学者相关信息找文献。号码途径较准,因为搜索是基于编码,不会重复或者错乱。常见的编码有DOI,ISSN和ISDN等。

内部途径是与搜索字符含义有关的。基于科研论文的情况,通常分类途径是按学科分类,但是新交叉学科存在分类上的争议,不好使用该途径。主题途径是基于用户关键词搜索,为了保证高效,不用作者关键词需要规范化关键词。分类主题途径综合了以上2种内部途径方法。

检索技术是使用搜索框时需要掌握的规则。使用布尔逻辑检索,用(与*;或+;非)将关键词串联起来,此时涉及一个查全查准此消彼长的问题,此问题应先保证查全,再考虑查准,因为先查准会丢掉一些未知的信息。使用高级检索规定运算顺序,即加括号。使用位置检索规定检索字段之间的绝对位置和相对位置:

其中F是feature,P是paragraph,S是sentence,W是with且不可颠倒,N是next且可颠倒,n是中间相隔词的数目。截词检索主要用于只知道部分信息时,写入部分信息同时使用*代表所有字符。限制检索是限制基本信息进行筛选检索。

对于修改检索范围有以下检索技巧。对于扩大检索范围,可以关键词降低专有度,选择关键词的上位词,使用或连接关键词,删除不重要词(eg:adj,XXX意义),采用截词检索,扩大基本信息限制(eg标题到全文),调整位置运算符主要是调n(将n变大),换其他数据库检索。对于缩小检索范围,可采用专业词,关键词的下位词,用非or与连接关键词,缩小可检字段,搜索范围缩小到标题。

需要注意检索技巧。不使用意义不明的词(eg:XXX意义),因为此时所有含有意义字符串的结果会出现,降低效率。注意化学名词有多种形式。不使用自创词。缩写找全称。

检索流程是先课题分析,此时可从主题,学科,信息类型(article 或者 review),年代来考虑。获取基本需求后,再选择数据库,此时应注意web of science不一定全,因为收入该网站的文献有质量门槛。再确定检索词,按照数据库规则写出检索表达式,此过程中的流程是将需求切分到词,删去大词,细化关键词(即选择合适关键词)最后布尔逻辑组合。得到结果后调整得到最佳结果。

数据检索|文献检索|事实检索|yandex|Title vs topic|检索技术|检索技巧|的更多相关文章

  1. Hibernate检索策略(抓取策略)(Hibernate检索优化)

    一.查询方法中get方法采用策略是立即检索,而load方法采用策略是延迟检索,延迟检索是在使用数据时才发送SQL语句加载数据 获取延迟加载数据方式:1.使用的时候,如果Customer c=sessi ...

  2. hibernate(八) Hibernate检索策略(类级别,关联级别,批量检索)详解

    序言 很多看起来很难的东西其实并不难,关键是看自己是否花费了时间和精力去看,如果一个东西你能看得懂,同样的,别人也能看得懂,体现不出和别人的差距,所以当你觉得自己看了很多书或者学了很多东西的时候,你要 ...

  3. Hibernate学习(八)———— Hibernate检索策略(类级别,关联级别,批量检索)详解

    序言 很多看起来很难的东西其实并不难,关键是看自己是否花费了时间和精力去看,如果一个东西你能看得懂,同样的,别人也能看得懂,体现不出和别人的差距,所以当你觉得自己看了很多书或者学了很多东西的时候,你要 ...

  4. iOS原生地图开发进阶——使用导航和附近兴趣点检索

    iOS原生地图开发进阶——使用导航和附近兴趣点检索 iOS中的mapKit框架对国际化的支持非常出色.在前些篇博客中,对这个地图框架的基础用法和标注与覆盖物的添加进行了详细的介绍,这篇博客将介绍两个更 ...

  5. 百度地图开发之poi检索,线路规划

      官方文档 http://lbsyun.baidu.com/index.php?title=androidsdk/guide/key 先去官方文档申请秘钥下载压缩文件等操作,参考 百度地图的秘钥申请 ...

  6. iOS百度地图路径规划和POI检索详细总结-b

    路径规划.png 百度地图的使用 百度地图API的导入网上说了许多坑,不过我遇到的比较少,这里就放两个比较常见的吧.坑一: 奥联WIFI_xcodeproj.png 如上图所示,在infoplist里 ...

  7. 链表与Hash检索实测

    测试环境: Win7 SP1.8G内存.3.4GHz 4核 测试代码: using System; using System.Collections.Generic; using System.Lin ...

  8. Lucene-----信息检索技术

    1 信息检索概述 1.1 传统检索方式的缺点     • 文件检索        操作系统常见的是硬盘文件检索        文档检索:整个文档打开时已经加载到内存了;        缺点:全盘遍历, ...

  9. 我的solr学习笔记--solr admin 页面 检索调试

    前言 Solr/Lucene是一个全文检索引擎,全文引擎和SQL引擎所不同的是强调部分相关度高的内容返回,而不是所有内容返回,所以部分内容包含在索引库中却无法命中是正常现象.      多数情况下我们 ...

随机推荐

  1. Ubuntu---不能打开 exfat 文件系统格式的 U盘解决方法

    出现问题:今天把 U 盘插入 Ubuntu 系统的电脑中,打开 U 盘发现弹出 系统格式不支持 的提醒,无法进入 U 盘进行操作. 环境: Ubuntu18.04 TSL; 格式化为 exfat 文件 ...

  2. 题解 P2981 【[USACO10FEB]奶牛在冰Cows on Ice】

    楼上的思路都是从一个石头找跳到另一个石头的路径,但其实这题可以对于上下左右四个方向分别做一个虚拟节点,然后只需要找虚拟节点左边的虚拟节点就行了 问题是:不会用set怎么办??? 其实可以发现用vect ...

  3. fiddler抓包可以抓到电脑数据抓不到手机上的数据------防火墙问题

    1.确保手机与电脑处于同一局域网,网络没问题,手机代理设置无误 2.确保fiddler设置没有任何问题 3.如果此时还是无法抓包,请打开控制面板----Windows防火墙------允许程序通过Wi ...

  4. nm命令介绍

    一.参考文章 网址1:https://linuxtools-rst.readthedocs.io/zh_CN/latest/tool/nm.html 参考2: man nm 参考3:<linux ...

  5. 翻译——1_Project Overview, Data Wrangling and Exploratory Analysis-checkpoint

    为提高提高大学能源效率进行建筑能源需求预测 本文翻译哈佛大学的能源分析和预测报告,这是原文 暂无数据源,个人认为学习分析方法就足够 内容: 项目概述 了解数据 探索性分析 使用不同的机器学习方法进行预 ...

  6. Windows安装使用Jenkins

    #前提条件是要把JDK安装好 1.下载jenkins:https://jenkins.io/download/ 选择windows版本 2.安装成功过后自己会启动 如果想自己启动(这两个需要以管理员方 ...

  7. C语言入门基础整理

    学习计算机技术,C语言可以说是必备的,他已经成为现在计算机行业人学习必备的,而且应用也是十分的广泛,今天就来看看拥有几年c语言工作经验的大神整理的C语言入门基础知识,没有学不会,只有不肯学. 结构化程 ...

  8. Linux常见指令x-mind

  9. 十一、linux-mysql的多种日志和引擎文件实战

    一.多种日志 mysql生成或者相关联的日志文件种类繁多,本节重点关注与mysql数据库服务相关的几类日志文件. 错误日志(error  log) :记录mysql服务进程mysqld在启动/关闭或者 ...

  10. 文件流下载时 axios blob文件大小不正确?

    文件流下载时 js blob文件大小不正确? res.data的字节长度 length blob.size匹配不上.. axio请求里必须修改 responseType: 'blob' 参数, 默认是 ...