solr4.0.0学习（二）数据库导入clob与blob为索引

导入clob很简单。但是blob好像没有提供方法，所以改了一下源码，重新编译替换class文件，竟然成功了。

先把配置文件贴上

SCHEMA.XML

<?xml version="1.0" ?>

<schema name="test" version="1.1">

  <types>

   <fieldtype name="string"  class="solr.StrField" sortMissingLast="true" omitNorms="true"/>

   <fieldType name="standard" class="solr.TextField" positionIncrementGap="100">

	  <analyzer type="index">

		<tokenizer class="solr.StandardTokenizerFactory"/>

		<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />

		<filter class="solr.LowerCaseFilterFactory"/>

	  </analyzer>

	  <analyzer type="query">

		<tokenizer class="solr.StandardTokenizerFactory"/>

		<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />

		<filter class="solr.LowerCaseFilterFactory"/>

	  </analyzer>

	</fieldType>

	<fieldType name="ik" class="solr.TextField">

       <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

	</fieldType>

  </types>

 <fields>

  <field name="blogId"      type="string"   indexed="false"  stored="true"  multiValued="false"/>

  <field name="blogTitle"   type="ik"   indexed="true"  stored="true"  multiValued="false" />

  <field name="blogAuthorName"   type="ik"   indexed="true"  stored="true"  multiValued="false" />

  <field name="blogContent"   type="ik"   indexed="true"  stored="true"  multiValued="false" />

  <field name="TITLE"   type="ik"   indexed="true"  stored="true"  />

  <field name="TEXT"   type="ik"   indexed="true"  stored="true"  />

 </fields>

 <defaultSearchField>blogTitle</defaultSearchField>

 <solrQueryParser defaultOperator="OR"/>

</schema>

这里的field只用到了blogContent一个。

SOLRCONFIG.XML

<?xml version="1.0" encoding="UTF-8" ?>

<config>

  <luceneMatchVersion>LUCENE_34</luceneMatchVersion>

  <directoryFactory name="DirectoryFactory" class="${solr.directoryFactory:solr.StandardDirectoryFactory}"/>

  <updateHandler class="solr.DirectUpdateHandler2" />

  <requestDispatcher handleSelect="true" >

    <requestParsers enableRemoteStreaming="false" multipartUploadLimitInKB="2048" />

  </requestDispatcher>

  <requestHandler name="standard" class="solr.StandardRequestHandler" default="true" />

  <requestHandler name="/update" class="solr.XmlUpdateRequestHandler" />

  <requestHandler name="/admin/" class="org.apache.solr.handler.admin.AdminHandlers" />

 <!-- the dataimport requestHandler -->

       <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">

               <lst name="defaults">

              <str name="config">db-data-config.xml</str>

             </lst>

       </requestHandler> 

  <admin>

    <defaultQuery>solr</defaultQuery>

  </admin>

  <unlockOnStartup>true</unlockOnStartup>

	<lockType>simple</lockType>

  <requestHandler name="/analysis/field"

                  startup="lazy"

                  class="solr.FieldAnalysisRequestHandler" />

</config>

db-data-config.xml

<dataConfig>

<dataSource name="f1" type="FieldStreamDataSource"/>

 <dataSource driver="oracle.jdbc.driver.OracleDriver"

 url="jdbc:oracle:thin:@127.0.0.1:1521:orcl" user="HT" password="HT"/>

 <document>

		<entity name="blog" query="SELECT BLOG_CONTENT from  TB_ENT_BLOG" transformer="ClobTransformer">

				 <field column="BLOG_CONTENT" name="blogContent" clob="true"/>

		</entity>

 </document>

</dataConfig>

然后修改了ClobTransformer.java。使其同时支持BLOG格式。

package org.apache.solr.handler.dataimport;

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.io.Reader;

import java.sql.Blob;

import java.sql.Clob;

import java.sql.SQLException;

import java.util.ArrayList;

import java.util.List;

import java.util.Map;

public class ClobTransformer extends Transformer

{

  public static final String CLOB = "clob";

  public Object transformRow(Map<String, Object> aRow, Context context)

  {

    for (Map map : context.getAllEntityFields()) {

      if ("true".equals(map.get("clob"))) {

        String column = (String)map.get("column");

        String srcCol = (String)map.get("sourceColName");

        if (srcCol == null)

          srcCol = column;

        Object o = aRow.get(srcCol);

        if ((o instanceof List)) {

          List inputs = (List)o;

          List results = new ArrayList();

          for (Object input : inputs) {

            if ((input instanceof Clob)) {

              Clob clob = (Clob)input;

              results.add(readFromClob(clob));

            }else if(input instanceof Blob){

            	Blob blob = (Blob)input;

            	results.add(readFromBlob(blob));

            }

          }

          aRow.put(column, results);

        }

        else if ((o instanceof Clob)) {

          Clob clob = (Clob)o;

          aRow.put(column, readFromClob(clob));

        }else if(o instanceof Blob){

        	Blob blob = (Blob)o;

        	aRow.put(column, readFromBlob(blob));

        }

      }

    }

    return aRow;

  }

  private String readFromBlob(Blob blob) {

	  try{

		  	InputStream is = blob.getBinaryStream();

			BufferedReader br = new BufferedReader(new InputStreamReader(is));

			String str = "";

			String res = "";

			while((str=br.readLine())!=null){

				res += str;

			}

			return res;

	  }catch (Exception e) {

		  e.printStackTrace();

		  return "";

	}

}

private String readFromClob(Clob clob) {

    Reader reader = null;

	try {

		reader = clob.getCharacterStream();

	} catch (SQLException e1) {

		e1.printStackTrace();

	}

    StringBuilder sb = new StringBuilder();

    char[] buf = new char[1024];

    try

    {

      int len;

      while ((len = reader.read(buf)) != -1)

        sb.append(buf, 0, len);

    }

    catch (IOException e) {

      DataImportHandlerException.wrapAndThrow(500, e);

    }

    return sb.toString();

  }

}

这里加了一个readFromBlob方法，加了两个else if。异常的处理很粗糙。

这样替换class文件，导入索引就正常了。在query ":" 页面的response会出现所有blob内容。

如果response没有blob字段或者显示为对象地址，都是错了。

solr4.0.0学习（二）数据库导入clob与blob为索引的更多相关文章

Redis 3.0中文版学习(二)
网址:http://wiki.jikexueyuan.com/project/redis-guide/entry-to-master-middle.html 1.Redis的列表: 采用链表的实现方法 ...
python 3+djanjo 2.0.7简单学习(二）--创建数据库和模型
我们紧接上次,这里将建立数据库,创建第一个模型提示:这里我们不需要去一直启动,django会在我们ctrl+s的时候自动刷新并启动服务,很方便吧 1.数据库配置现在,打开 vote_mysite/ ...
Solr4.8.0源码分析(19)之缓存机制(二)
Solr4.8.0源码分析(19)之缓存机制(二) 前文<Solr4.8.0源码分析(18)之缓存机制(一)>介绍了Solr缓存的生命周期,重点介绍了Solr缓存的warn过程.本节将更深 ...
Solr学习(2) Solr4.2.0+IK Analyzer 2012
Solr学习(二) Solr4.2.0+IK Analyzer 2012 开场白: 本章简单讲述如何在solr中配置著名的 IK Analyzer 分词器. 本章建立在 Solr学习(一) 基础上进 ...
【Flask】 python学习第一章 - 6.0 WTF表单数据库蓝图
WTF表单 wtf.py pip install flask-wtf # 安装 from flask_wtf import FlaskForm from wtform import StringF ...
Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)
Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二) 题记: 前文<Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一)>中提 ...
Red Gate系列之二 SQL Source Control 3.0.13.4214 Edition 数据库版本控制器完全破解+使用教程
原文:Red Gate系列之二 SQL Source Control 3.0.13.4214 Edition 数据库版本控制器完全破解+使用教程 Red Gate系列之二 SQL Source Co ...
solr8.0 从数据库导入数据（三）
第一步:导入相关包: 在创建的核心目录下新建lib文件夹(如果有,无需建立),从Solr源码包的dist文件夹中导入两个solr-dataimporthandler包,以及一个mysql驱动包. 第二 ...
Swift3.0基础语法学习<二>
对象和类: // // ViewController2.swift // SwiftBasicDemo // // Created by 思彭 on 16/11/15. // Copyright © ...

随机推荐

DOM 文档对象模型
document 对象(作为对象),是 DOM 的核心作用:对内容,属性,样式等操作属性:title:设置/返回当前文档的标题url:返回当前文档的 urlinnerHTML:获取指定对象内的内容bg ...
犯这个错误的肯定不止我一个关于File
File.Create(string filePath)这种用法所有人都知道,这两天用到的时候却发现一个问题. 需要先判断文件是否存在,如果不存在则创建文件,然后向该文件写入数据,后续定时Append ...
a标签拨打电话、发短信、发邮件
1.<a href=”tel:xxxx”>拨打电话</a> 2.<a href=”sms:xxxx”>发短信</a> 3.<a href=”mai ...
Linux下find指令
Linux是一个“一切皆文件”的操作系统,find(查找文件)指令就尤为重要了.find命令在目录结构中搜索文件,并执行指定的操作. 1.命令格式: find pathname -options [- ...
ubuntu maven 安装设置
http://blog.csdn.net/tiefanhe/article/details/9774189 1.安装 maven ,下载地址:http://maven.apache.org/downl ...
关于后缀数组的倍增算法和height数组
自己看着大牛的论文学了一下后缀数组,看了好久好久,想了好久好久才懂了一点点皮毛TAT 然后就去刷传说中的后缀数组神题,poj3693是进化版的,需要那个相同情况下字典序最小,搞这个搞了超久的说. 先简 ...
linux使用su切换用户提示 Authentication failure的解决方法& 复制文件时，报cp: omitting directory `XXX'
linux使用su切换用户提示 Authentication failure的解决方法:这个问题产生的原因是由于ubtun系统默认是没有激活root用户的,需要我们手工进行操作,在命令行界面下,或者在 ...
Android ListView内容变化后的动态刷新
ListView内容变化后的动态刷新基本知识点: 1.更新适配器Adapter数据源 2.调用适配器Adapter的刷新方法notifyDataSetChanged() 首先需要定义ListView ...
CCS3.3之DM642开发环境建立
使用的仿真器是SEED-XDSUSB2.0/5V. 之前用的是CCS2.2,换成了CCS3.3的. 1.安装CCS3.3.38.在我安装完后,并没有急着升级,升级的程序是SR12_CCS_v3.3_S ...
Automatic Code Generation-->Implement Interface
https://msdn.microsoft.com/en-us/library/hk90416s(v=vs.110).aspx VS中自带的只能提示,一个类继承自某一个接口. 由VS为类生成接口所要 ...

solr4.0.0学习（二） 数据库导入clob与blob为索引

solr4.0.0学习（二） 数据库导入clob与blob为索引的更多相关文章

随机推荐

热门专题

solr4.0.0学习（二）数据库导入clob与blob为索引

solr4.0.0学习（二）数据库导入clob与blob为索引的更多相关文章