关于SQLSERVER的全文目录跟全文索引的区别

很久没有写随笔了，本来之前想写一篇关于SQLSERVER全文索引的随笔，可惜没有时间，一直拖到现在才有时间写，不好意思让各位久等了~

先介绍一下SQLSERVER中的存储类对象，哈哈，先介绍一下概念嘛，让新手老手都有一个认知

SQLSERVER Management Studio将【全文目录】、【分区函数】以及【分区方案】节点纳入其【对象资源管理器】的【存储】节点之中，

如下图所示：

正文来了！哈哈，有请主角：全文目录

全文目录

数据库【存储】|【全文目录】节点是用于保存和管理【全文索引】的节点。全文目录通常是由同一数据库中的零个或多个数据表的全文索引构成的。

需要注意的是，只能为每个数据表创建一个全文索引。因此，一旦在某个数据表上创建了全文索引，那么该数据表将只能隶属于一个全文目录。换言之，

一个数据库可以包含一个或多个全文目录，一个全文目录可以包含一个或多个全文索引，但一个数据表只能有一个数据库全文目录和全文索引(跟mysql一样)。

在SQLSERVER2005中使用全文索引的主要步骤如下：

（1）首先需要创建全文目录。

（2）然后将需要创建全文索引的数据表中的数据填充到全文目录中。这一过程也被称为填充全文索引。

（3）完成上述两步之后，即可开始使用全文索引功能。

创建全文目录的方法非常简单。通过SSMS以及T-SQL都可以实现创建全文目录的功能。

至于具体的创建步骤嘛，这里就不说了，网上都有文章说明，我就不转载了

最后说一下全文索引的优缺点和注意事项：

（1）全文索引可对char、varchar、nchar、nvarchar、text、ntext、image、xml、varbinary 或 varbinary(max) 类型字段进行检索，

是解决海量数据模糊查询的好办法。

（2）一个表只能建立一个全文索引（但可以对多个字段）。

（3）与like的比较 MSDN解释

与全文搜索不同，LIKE Transact-SQL 谓词仅对字符模式（ char、varchar、nchar、nvarchar）有效。另外，不能使用 LIKE 谓词来查询格式化的二进制数据。此外，对大量非结构化的文本数据执行 LIKE 查询要比对相同数据执行同样的全文查询慢得多。对数百万行文本数据进行的 LIKE 查询可能需要几分钟的时间才能返回结果；而对于同样的数据，全文查询只需要几秒甚至更少的时间，具体取决于返回的行数及其大小。另一个考虑因素是 LIKE 仅对整个表执行简单模式扫描。相反，全文查询可识别语言，它在索引和查询时应用特定的转换，例如，筛选非索引字并进行同义词库和变形扩展。这些转换可帮助全文查询改进其撤回以及结果的最终排名

最最后，讲一下全文索引的用法：

SQL Server 2000和SQLSERVER2005提供的全文检索语句主要有CONTAINS和FREETEXT。（1）CONTAINS语句的功能是在表的所有列或指定列中搜索：一个字或短语；一个字或短语的前缀；与一个字相近的另一个字；一个字的派生字；一个重复出现的字。

（2）FREETEXT语句的功能是在一个表的所有列或指定列中搜索一个自由文本格式的字符串，并返回与该字符串匹配的数据行。所以，FREETEXT语句所执行的功能又称做自由式全文查询。

T-SQL语句

1 USE pratice

2

3 SELECT *  FROM  dbo.test WHERE CONTAINS(d,'基数行')

pratice是我的一个测试数据库，d是test表的其中一个字段，以上T-SQL语句的意思是查找d字段里包含字符串"基数行"的记录

--下列 T-SQL 指令碼示範查詢全文檢索索引狀態以及其內容。

SELECT * FROM sys.dm_fts_index_population

SELECT * FROM sys.dm_fts_index_keywords( DB_ID('tde'), OBJECT_ID('SalesLT.Product'))

http://blogs.technet.com/b/technet_taiwan/archive/2015/06/02/sql-database-new-features-tde-and-full-text-search.aspx

填充的方式有3种：1、完全填充，2、增量填充，3、自动跟踪更改

sql2008 的全文索引现在是存储在数据库中全文索引基于CHAR/VARCHAR/NVARCHAR/XML/VARBINARY 提供了50个筛选器全文索引使用语言特有的断字符word breaker 和词干分析器stemmer 指定具体语言，单词之间的breaker 被排除在常用单词（字）外面的单词（字）称为干扰词stop word，通过指定干扰词避免大量根本算不上关键字的单词（字）所干扰一个表/索引视图只能有一个全文索引 stemmer n. 抽梗机，除梗器；抽梗工人

一定要使用单独的文件组来存放全文目录！

全文索引填充不是即时完成的，因为数据必须提交给索引引擎，再由索引引擎应用断字符，词干分析器，语言文件，干扰词列表stop lists，最后才将更改合并到索引 merge到索引

语言规范决定了由全文索引引擎需要加载的断字符和词干分析器

SQL2008有第三方断字符和词干分析器

断字符还能识别数据中的单词之间的距离，这种接近性（proximity）添加到全文数据中，mysql的全文也有近似性，这是全文索引的独有功能，like%%是做不到的

sqlserver使用词干分析器来识别关键词的各种形式变化

全文谓词（全文搜索关键词）提交给全文索引引擎，全文索引引擎利用断字符word breaker标记搜索关键词，加token，将数据返回给优化器

where后面的谓词，如果不是全文，就叫谓词，如果是全文就是全文谓词

language参数指定是，是哪一个国家语言

优化器不能通过参数嗅探来计算全文索引上的分别统计数据，为了获得最佳性能必须给全文搜索的所有关键字都是Unicode类型

同义词文件

创建同义词XML文件添加干扰词列表重建全文索引干扰词列表stop list或noise word file 如果你在一个全文谓词中提交的参数是干扰词，查询不会返回任何结果（而且他根本不需要访问底层数据） sql2005和更早版本在FTDATA文件夹下配置干扰词文件，sql2008的干扰词列表存放在sqlserver的一个数据库中

增量填充全文索引必须要有一个时间戳

同义词和干扰词存放路径 C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\FTData

C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\FTData文件夹下只有两种文件：同义词和干扰词存

干扰词列表stop list或noise word file或stop word

全文关键术语

关于SQLSERVER的全文目录跟全文索引的区别的更多相关文章

解决SQL Server Management Studio Express不支持更新全文目录的方法
微软的说法:https://msdn.microsoft.com/zh-cn/library/ms365247.aspx 可以用命令创建: A.创建唯一索引.全文目录和全文索引以下示例对 Adven ...
sqlserver中表变量和变量表之间区别
sqlserver中表变量和变量表之间区别
Access、SQLServer、Oracle常见SQL语句应用区别
Access.SQLServer.Oracle常见SQL语句应用区别关劲松 PMP 如果要兼容Access.SQL Server.Oracle三个数据库版本:我们在编写SQL语句的过程中,尽量使用一 ...
linux中bin与sbin目录的作用及区别介绍
linux中bin与sbin目录的作用及区别介绍本文介绍下,linux中的二个主要目录:bin与sbin,它们的作用与区别,学习linux的朋友可以参考下在linux系统中,有两个重要的目录:bi ...
Linux学习教程 | 全文目录
本教程最大的特点是通俗易懂,并且非常详细,花费 7 天时间即可快速了解 Linux. 第一章 Linux简介 1.1 操作系统是什么,操作系统概述 1.2 Linux是什么,有哪些特点? 1.3 Li ...
【T-SQL】系列文章全文目录（2017-06-02更新）
本系列[T-SQL]主要是针对T-SQL的总结. T-SQL基础 [T-SQL基础]01.单表查询-几道sql查询题 [T-SQL基础]02.联接查询 [T-SQL基础]03.子查询 [T-SQL基础 ...
【T-SQL】系列文章全文目录（2017-06-26更新）
本系列[T-SQL]主要是针对T-SQL的总结. SQL基础 [T-SQL基础]01.单表查询-几道sql查询题 [T-SQL基础]02.联接查询 [T-SQL基础]03.子查询 [T-SQL基础]0 ...
SQLServer中临时表与表变量的区别分析(转)
在实际使用的时候,我们如何灵活的在存储过程中运用它们,虽然它们实现的功能基本上是一样的,可如何在一个存储过程中有时候去使用临时表而不使用表变量,有时候去使用表变量而不使用临时表呢? 临时表临时表与永 ...
SQLServer中临时表与表变量的区别分析
临时表临时表与永久表相似,只是它的创建是在Tempdb中,它只有在一个数据库连接结束后或者由SQL命令DROP掉,才会消失,否则就会一直存在.临时表在创建的时候都会产生SQL Server的系统日志 ...

随机推荐

modprobe lsmod
modprobe是linux的一个命令,可载入指定的个别模块,或是载入一组相依的模块.modprobe会根据depmod所产生的相依关系,决定要载入哪些模块.若在载入过程中发生错误,在modprobe ...
Java堆空间溢出解决方法 Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
一般通过java -jar filename.jar运行jar包,但是当运行的java程序需要较大的内存时,可能会造成堆空间溢出. 例如,加载了几个G大小的json文件,运行报错: Exception ...
EXC_BAD_ACCESS(code...)坏内存访问调试
一般很多人遇到这个都会崩溃断点一般找不到原因 : 只能按照一步一步走readView的模式 : 一般是问题是相互包含比如 view2 在view1 上但是在view2 又创建了一 ...
Linux之Ubuntu
1.1 使用创建用户登陆 Ubuntu 默认root用户无法登陆,只能使用在安装系统的时候新创建的用户登录我这里新建的用户是ubuntu密码111111 1.2 安装ssh server 由于新建的 ...
PHP 关于empty和isset对于参数的判断结果
<?php class test{} $a1 = null; $a2 = ""; //$a3 = $a4 = 0; $a5 = '0'; $a6 = false; $a7 = ...
Apache下配置Openstack Horizon （转）
非常详尽的Horizon配置介绍,转自 dev.cloudwatt.com Deploy Horizon from source with Apache and SSL Some companies ...
关于FreeMarker自定义TemplateDirectiveModel
[转载来源:http://zwllxs.iteye.com/blog/2036826] java代码如下: import freemarker.core.Environment; import fre ...
Java并发--线程间协作的两种方式：wait、notify、notifyAll和Condition
在前面我们将了很多关于同步的问题,然而在现实中,需要线程之间的协作.比如说最经典的生产者-消费者模型:当队列满时,生产者需要等待队列有空间才能继续往里面放入商品,而在等待的期间内,生产者必须释放对临界 ...
BZOJ1345 Baltic2007 序列问题Sequence 【思维题】*
BZOJ1345 Baltic2007 序列问题Sequence Description 对于一个给定的序列a1,…,an,我们对它进行一个操作reduce(i),该操作将数列中的元素ai和ai+1用 ...
Django 资源文件配置
staticfiles: 这是一个静态资源管理的app,django.contrib.staticfiles.老的版本中,静态资源管理一直是一个问题,部分app发布的时候需要带上静态资源,在部署的时 ...

关于SQLSERVER的全文目录跟全文索引的区别

关于SQLSERVER的全文目录跟全文索引的区别的更多相关文章

随机推荐

热门专题