bleve搜索引擎源码分析之索引——mapping和lucene一样，也有

例子：

package main

import (

    "fmt"

    "github.com/blevesearch/bleve"

)

func main() {

    // open a new index

    mapping := bleve.NewIndexMapping()

    index, err := bleve.New("example.bleve", mapping)

    if err != nil {

        fmt.Println(err)

        return

    }

    data := struct {

        Name string

        Des  string

    }{

        Name: "hello world this is bone",

        Des:  "this is a good time",

    }

    // index some data

    index.Index("id", data)

    // search for some text

    query := bleve.NewMatchQuery("this is bone")

    search := bleve.NewSearchRequest(query)

    searchResults, err := index.Search(search)

    if err != nil {

        fmt.Println(err)

        return

    }

    fmt.Println(searchResults)

}

mapping这里：

// NewIndexMapping creates a new IndexMapping that will use all the default indexing rules

func NewIndexMapping() *mapping.IndexMappingImpl {

    return mapping.NewIndexMapping()

}

难道是使用和lucene一样的？？？

// NewIndexMapping creates a new IndexMapping that will use all the default indexing rules

func NewIndexMapping() *IndexMappingImpl {

    return &IndexMappingImpl{

        TypeMapping:           make(map[string]*DocumentMapping),

        DefaultMapping:        NewDocumentMapping(),

        TypeField:             defaultTypeField,

        DefaultType:           defaultType,

        DefaultAnalyzer:       defaultAnalyzer,

        DefaultDateTimeParser: defaultDateTimeParser,

        DefaultField:          defaultField,

        IndexDynamic:          IndexDynamic,

        StoreDynamic:          StoreDynamic,

        CustomAnalysis:        newCustomAnalysis(),

        cache:                 registry.NewCache(),

    }

}

New就是设置索引目录和mapping。

// New index at the specified path, must not exist.

// The provided mapping will be used for all

// Index/Search operations.

func New(path string, mapping mapping.IndexMapping) (Index, error) {

    return newIndexUsing(path, mapping, Config.DefaultIndexType, Config.DefaultKVStore, nil)

}

index文档实现:

// Index adds the specified index operation to the

// batch.  NOTE: the bleve Index is not updated

// until the batch is executed.

func (b *Batch) Index(id string, data interface{}) error {

    if id == "" {

        return ErrorEmptyID

    }

    doc := document.NewDocument(id)

    err := b.index.Mapping().MapDocument(doc, data)

    if err != nil {

        return err

    }

    b.internal.Update(doc)

    return nil

}

其中，NewDocument实现：

type Document struct {

    ID              string  `json:"id"`

    Fields          []Field `json:"fields"`

    CompositeFields []*CompositeField

    Number          uint64 `json:"-"`

}

func NewDocument(id string) *Document {

    return &Document{

        ID:              id,

        Fields:          make([]Field, ),

        CompositeFields: make([]*CompositeField, ),

    }

}

MappingDocument实现：

func (im *IndexMappingImpl) MapDocument(doc *document.Document, data interface{}) error {

    docType := im.determineType(data)

    docMapping := im.mappingForType(docType)

    walkContext := im.newWalkContext(doc, docMapping)

    if docMapping.Enabled {

        docMapping.walkDocument(data, []string{}, []uint64{}, walkContext)

        // see if the _all field was disabled

        allMapping := docMapping.documentMappingForPath("_all")

        if allMapping == nil || (allMapping.Enabled != false) {

            field := document.NewCompositeFieldWithIndexingOptions("_all", true, []string{}, walkContext.excludedFromAll, document.IndexField|document.IncludeTermVectors)

            doc.AddField(field)

        }

    }

    return nil

}

我晕，看来bleve真的是和lucene设计一样！也有_all属性。

难道后面倒排列表也会使用skip list？？？

bleve搜索引擎源码分析之索引——mapping和lucene一样，也有_all的更多相关文章

bleve搜索引擎源码分析之索引——mapping真复杂啊
接下来看看下面index部分的源码实现: data := struct { Name string Des string }{ Name: "hello world this is bone ...
Spark源码分析 – 汇总索引
http://jerryshao.me/categories.html#architecture-ref http://blog.csdn.net/pelick/article/details/172 ...
wukong引擎源码分析之索引——part 1 倒排列表本质是有序数组存储
searcher.IndexDocument(0, types.DocumentIndexData{Content: "此次百度收购将成中国互联网最大并购"}) engine.go ...
wukong引擎源码分析之索引——part 3 文档评分无非就是将docid对应的fields信息存储起来，为搜索结果rank评分用
之前的文章分析过,接受索引请求处理的代码在segmenter_worker.go里: func (engine *Engine) segmenterWorker() { for { request : ...
lua源码分析伪索引
Lua 提供了一个注册表, 这是一个预定义出来的表, 可以用来保存任何 C 代码想保存的 Lua 值. 这个表可以用有效伪索引 LUA_REGISTRYINDEX 来定位. 任何 C 库都可以在这张 ...
wukong引擎源码分析之索引——part 2 持久化直接set（key，docID数组）在kv存储里
前面说过,接收indexerRequest的代码在index_worker.go里: func (engine *Engine) indexerAddDocumentWorker(shard int) ...
4 weekend110的textinputformat对切片规划的源码分析 + 倒排索引的mr实现 + 多个job在同一个main方法中提交
好的,现在,来weekend110的textinputformat对切片规划的源码分析, Inputformat默认是textinputformat,一通百通. 这就是今天,weekend110的te ...
【异常及源码分析】org.mybatis.spring.MyBatisSystemException: nested exception is org.apache.ibatis.type.TypeException: Could not set parameters for mapping: ParameterMapping
一.异常出现的场景 1)异常出现的SQL @Select("SELECT\n" + " id,discount_type ,min_charge, ${cardFee} ...
Solr4.8.0源码分析(14)之SolrCloud索引深入(1)
Solr4.8.0源码分析(14) 之 SolrCloud索引深入(1) 上一章节<Solr In Action 笔记(4) 之 SolrCloud分布式索引基础>简要学习了SolrClo ...

随机推荐

linux 管道符号 | ，以及&& ||等等特殊符号笔记
管道和重导向:“|”.“>”.“>>”.“<” 重导向就是使命令改变它所认定的标准输出.“>”可将结果输出到文件中,该文件原有内容会被删除,“>>”则将结果附 ...
ci框架——分页
1:在models里面写一个模型:page_model.php class Page_model extends CI_Model{ function page($tablename,$per_num ...
最短路中部分点只能从中任意选取K个问题
题意:给N个点,还有另外m个点(其中只能选K个),求最短路. 思路:在SPFA的基础上,用一个数组来统计,在某点入队时(要拓展其他点了),若该点是m个点中的,则count[i]=原来的+1:若不是,则 ...
Croc Champ 2013 - Round 2 C. Cube Problem
问满足a^3 + b^3 + c^3 + n = (a+b+c)^3 的 (a,b,c)的个数可化简为 n = 3*(a + b) (a + c) (b + c) 于是 n / 3 = (a + b ...
马蜂窝ABTest多层分流系统的设计与实现
什么是 ABTest 产品的改变不是由我们随便「拍脑袋」得出,而是需要由实际的数据驱动,让用户的反馈来指导我们如何更好地改善服务.正如马蜂窝 CEO 陈罡在接受专访时所说:「有些东西是需要 Sen ...
python文件追加及时间获取
一.python:文件的读取.创建.追加.删除.清空 2011-10-24 11:36:35| 分类: python |举报 |字号订阅一.用Python创建一个新文件,内容是从0到9的整数 ...
qq空间微博等更多社交平台分享
<!DOCTYPE html><html> <head> <meta charset="UTF-8"> <title>& ...
virtualenv 配置python3环境
virtualenv -p /usr/bin/python3 py3env source py3env/bin/activate pip install package-name
Mathematica 表达式求值
表达式是变量之间的运算关系.表达式求值就是对变量赋值并运算出结果的过程. 针对于Mathematica中的表达式.有两种方法获得其值. 一是对对应的变量直接赋值.这样对应的表达式在调用时便会直接运算得 ...
JAVA_MyEclipse如何加载Tomcat
注意Tomcat不要放到Program Files这种有空格的路径下面!,下图所示是错误的

bleve搜索引擎源码分析之索引——mapping和lucene一样，也有_all

bleve搜索引擎源码分析之索引——mapping和lucene一样，也有_all的更多相关文章

随机推荐

热门专题