1.4.2 solr字段类型--(1.4.2.1)字段类型定义和字段类型属性
1.4.2 solr字段类型
字段类型定义和字段类型属性
字段类型元素fieldType包含4个信息的类型:name,class-实现类的名称,analyzer-用于字段类型的分析,字段属性Field.
schema.xml中定义字段类型
字段类型定义在schema.xml中的types元素下,每个字段类型都在filedType元素之间定义,下面是一个 text_general的例子:
<fieldType name="text_general" class="solr.TextField"
positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt"
ignoreCase="true" expand="true" />
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
上面例子中的第一行包含了字段类型的名称text_general,以及对应的实现类solr.TextField,剩下部分定义了字段的分析.
实现类是负责确保该字段的正确处理,在这个class名称中,字符串solr时 org.apache.solr.schema 或者org.apache.solr.analysis的简称.
字段类型属性
字段类型的class决定了字段类型的大部分行为,但是可选的属性也可以被定义.如下面的日期类型定义了sortMissingLast和omitNorms两个属性.
<fieldType name="date" class="solr.DateField" sortMissingLast="true" omitNorms="true" />
这个字段类型的属性可以分为三大类:
指定字段类型的类.
常规属性-solr所有字段类型都支持的属性.
字段默认属性-使用
常规属性
属性 | 描述 | 值 |
positionIncrementGap | 对于多值字段来说,在多个值之间指定一个距离,预防假的匹配现象. | integer |
autoGeneratePhraseQueries |
对于文本字段,如果为true,solr自动为相邻词语生成短语查询, 如果false,词语之间必须使用双引号才被当作短语查询. |
true或false |
docValuesFormat |
自定义一个DocValuesFormat,用于这个类型的字段,这就需要一个模式感知编码解码器(schema-aware), 如solrconfig.xml中定义的SchemaCodecFactory |
n/a |
postingsFormat | 自定义一个PostingsFormat,用于这个类型的字段,这就需要一个模式感知编码解码器(schema-aware),
如solrconfig.xml中定义的SchemaCodecFactory |
n/a |
字段默认属性
属性 | 描述 | 值 |
indexed | true:字段值可以用于查询检索 | true or false |
stored | true:实际字段值在索引中存储 | true or false |
docValues | true,字段值将被存放在一个一行为主(面向列)docValues结构中. | true or false |
sortMissingFirst sortMissingLast |
如果排序字段不存在时,用于控制文档的布局.自solr3.5起,这些应用于所有的numeric字段,tri和日期字段. | true or false |
multiValued | true,声明一个单独的文档的字段下可以包含多个值 | true or false |
omitNorms | true,忽略与此字段关联的规范,对所有的原始字段(不分词),默认为true.如int,float,data,bool,string.只有文本字段和需要索引时间加权的字段 需要规范(norms). | true or false |
omitTermFreqAndPositions | true,忽略词语的频率,位置和位置处的有效负载.对于不需要这些信息的字段,这是一个性能提升,同样也减少了索引的存储空间.依赖位置的查询,发布在使用这个选项上的字段,将无法找到匹配的文档.这个属性对所有的非文本字段默认为true. | true or false |
omitPositions | 和omitTermFreqAndPositions相似,但是保存词语的频率信息. | true or false |
termVectors termPositions termOffsets |
这些选项指示solr维护每个文档的全部词语的向量信息,可选择的包含每个词语在这些向量中出现的位置和偏移量信息.这些可以用于 加速高亮和其他辅助功能.但是在索引大小方面增加了相当一部分消耗.对于solr的标准使用来说时没有必要的. |
true or false |
1.4.2 solr字段类型--(1.4.2.1)字段类型定义和字段类型属性的更多相关文章
- C#基础(202)--类定义,字段与属性,自动属性,方法及常见错误
c#类的定义规范 字段与属性的比较: 字段: 字段主要是为类的内部做数据交换交互使用,字段一般是private 字段可以赋值,也可以取值 当字段需要为外部数据提供数据的时候,请将字段封装为属性,而不是 ...
- Scrapy框架的学习(6.item介绍以及items的使用(提前定义好字段名))转载https://blog.csdn.net/wei18791957243/article/details/86259688
在Scrapy框架中的items.py的作用 1.可以预先定义好要爬取的字段 items.py import scrapy class TencentItem(scrapy.I ...
- mysqlint类型的长度值mysql在建表的时候int类型后的长度代表什么
详解mysql int类型的长度值 mysql在建表的时候int类型后的长度代表什么 是该列允许存储值的最大宽度吗 为什么我设置成int(1), 也一样能存10,100,1000呢. 当时我虽然知道i ...
- sqlbulkcopy 使用DataTable作为数据源的数据类型问题--来自数据源的String类型的给定值不能转换为指定目标列的类型 uniqueidentifier
今天做批量插入的时候,SQLSERVER总是报错,错误提示“来自数据源的String类型的给定值不能转换为指定目标列的类型 uniqueidentifier”. 首先核对了一下定义的dataTable ...
- 定义类+类实例化+属性+构造函数+匿名类型var+堆与栈+GC回收机制+值类型与引用类型
为了让编程更加清晰,把程序中的功能进行模块化划分,每个模块提供特定的功能,而且每个模块都是孤立的,这种模块化编程提供了非常大的多样性,大大增加了重用代码的机会. 面向对象编程也叫做OOP编程 简单来说 ...
- 重构学习day01 类型码 类型码的上层建筑 与类型码相关的重构方法 1.使用子类代替类型码 2.使用状态或策略模式代替类型码
名词:类型码 类型码的上层建筑 重构方法 1.使用子类代替类型码 2.使用状态/策略模式代替类型码 类中存在方法把某个字段当作条件,根据字段值的不同,进行不同的处理.(自定义概念)则这个字段叫做:类型 ...
- SqlBulkCopy批量插入数据 显示 来自数据源的 String 类型的给定值不能转换为指定目标列的类型 smalldatetime。错误
因为需要大量插入数据,linq ef无法达到速度的要求,因此把模型转换成SQL ,使用SqlBulkCopy快速插入.但是去提示 来自数据源的 String 类型的给定值不能转换为指定目标列的类型 s ...
- ASP.NET - Web API,从简单类型到复杂类型的参数传递用例,以及传递简单string类型的解决办法
一,简单类型的传值 比如 public Users Get(int id) ,它可以使用两种方式获取: api/default/ $.get("/api/default",{id: ...
- 无法将类型为“System.Windows.Controls.SelectedItemCollection”的对象强制转换为类型“System.Collections.Generic.IList`1
在WPF中DataGrid 选择事件中获取SelectedItems 报错如下 无法将类型为“System.Windows.Controls.SelectedItemCollection”的对象强制转 ...
随机推荐
- 【131】如何讲好PPT
1 列提纲2 写稿子3 背稿子4 演练5遍,用自己的话说出来,最好和稿子一样,但不强求一样,关键要理解5 不一定要做,但是做好了会有很大提高,讲的时候也会很NB:有时间可以再演练几遍,录出来看看哪里需 ...
- [iOS微博项目 - 3.2] - 发送微博
github: https://github.com/hellovoidworld/HVWWeibo A.使用微博API发送微博 1.需求 学习发送微博API 发送文字微博 发送带有图片的微博 ...
- MyEclipse中无法将SVN检出来的项目部署到tomcat中
自己遇到的小问题 : 要以web项目方式从svn上倒下来才可以部署到tomcat下检出步骤: myEclipse -->File-->new-->other-->svn--& ...
- CCPC总结
[印象·南阳] 10月15日出发,威海—烟台—郑州—南阳,一路上欢声笑语,从谁是卧底到各类纸牌游戏,也是欢乐.在从郑州到南阳的车上,对面的好像是河南当地的学长,感叹道工作不易的样子,说还是学生时代最为 ...
- NAND flash NOR flash SDRAM区别
nand flash:适合大容量数据存储,类似硬盘:nor flash:适合小容量的程序或数据存储,类似小硬盘:sdram:主要用于程序执行时的程序存储.执行或计算,类似内存. 区别:nor flas ...
- jquery实现的个性网站首页 详细信息
http://download.csdn.net/detail/a757956132/9305419 实现效果: 1:导航效果(兼容IE) 2:网站换肤 3:模块展开和关闭 4:新闻滚动 5:超链接文 ...
- call()和apply()方法
还在处在刚刚学习JavaScript的初级阶段,所以理解相对浅显,是一种简单的模式理解.这里做一个笔记,让自己在回顾的时候,更加牢记. call()和apply()的形式 A.call(B," ...
- nginx 配置虚拟主机(支持php)
配置步骤: 1.在nginx安装目录下,找到nginx.conf所在文件夹,新建vhost文件夹 2.在nginx.conf http{} 末端加入 include vhost/*.conf; 3.进 ...
- 开发extjs常用的插件
Spket是目前支持Ext 2.0最为出色的IDE. 它采用.jsb project file 文件并将继承于基类和所有文档的内容嵌入到生成代码提示的Script doc中.注:不支持配置项的代码提示 ...
- Ucenter后台登陆 验证码CCCC的解决方法 无法登录解决办法
国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html 内部邀请码:C8E245J (不写邀请码,没有现金送) 国 ...