在文档服务器中存储有成千上万个文档的情况下，用户想要找到并打开包含特定关键字的文档，无疑是一项艰巨的任务。如何高效地管理和检索大量的Word文档呢？

在现有的技术解决方案中，许多方法都依赖于服务器端的Apache POI技术。这种技术的基本原理是，先将所有文档的文本内容提取出来，然后存储到数据库中。当用户需要打开文档时，系统会通过SQL语句检索数据库，判断文档是否包含用户指定的关键字。然而，这种解决方案存在明显的弊端。首先，POI技术对Word文档的支持并不完善，其提供的接口较为单一且稳定性不足，对文档格式的严格要求也增加了使用的难度。其次，将成千上万个文档的文本内容提取并存储到数据库中，这一操作本身就会对服务器的性能产生巨大的压力，影响服务器的正常运行。

PageOffice提供了一种新的解决方案。它能够在每次保存文件的时候获取Word文档的全文纯文本内容，并将其保存到数据库中。这样，当用户需要检索包含特定关键字的文档时，就可以直接通过数据库的SQL语句来实现。更为重要的是，PageOffice的这一功能是在客户端执行的，也就是说，它将文档的处理工作量从服务器端转移到了客户端，极大地减轻了服务器的负担，既能够满足用户对于文档检索的需求，又能够保证服务器的稳定运行。

后端代码

每次保存文档的同时，获取Word文档中的纯文本字符串并保存到数据库，以后就可以简单的利用SQL查询轻松实现文档管理中的全文检索功能。

  FileSaver fs = new FileSaver(request, response);

  String strDocumentText = fs.getDocumentText();

  // 您可以把strDocumentText保存到数据库字段。保存到数据库的代码此处省略

  fs.saveToFile(request.getRealPath("doc/" + fs.getFileName()));

  fs.close();

前端代码

在线打开Word文件之后，可以使用下面的SetKeyWord函数，设置Word文件中的所有的关键字高亮显示。



function SetKeyWord(key,visible) {

    if (key == "null" || "" == key) {

        alert("关键字为空。");

        return;

    }

    let falg = true;

    pageofficectrl.word.HomeKey(6);

    while(falg){

        if(pageofficectrl.word.FindNextText(key)){

            if(visible){

                pageofficectrl.word.SetHighlightToSelection(7);//高亮显示

            }else{

                pageofficectrl.word.SetHighlightToSelection(0);//取消高亮

            }

        }else{

            pageofficectrl.word.HomeKey(6)

            break;

        }

    }

}

参考链接：Word全文检索

PageOffice6 实现 word 全文检索的更多相关文章

jeecms系统使用介绍——通过二次开发实现对word、pdf、txt等上传附件的全文检索
转载请注明出处:http://blog.csdn.net/dongdong9223/article/details/76912307 本文出自[我是干勾鱼的博客] 之前在文章<基于Java的门户 ...
[转载] Java开发在线编辑Word同时实现全文检索
一.背景介绍 Word文档与日常办公密不可分,在实际应用中,当某一文档服务器中有很多Word文档,假如有成千上万个文档时,用户查找打开包含某些指定关键字的文档就变得很困难,一般情况下能想到的解决方案是 ...
[原创]Java开发在线编辑Word同时实现全文检索
一.背景介绍 Word文档与日常办公密不可分,在实际应用中,当某一文档服务器中有很多Word文档,假如有成千上万个文档时,用户查找打开包含某些指定关键字的文档就变得很困难,一般情况下能想到的解决方案是 ...
对服务器上所有Word文件做全文检索的解决方案-Java
一.背景介绍 Word文档与日常办公密不可分,在实际应用中,当某一文档服务器中有很多Word文档,假如有成千上万个文档时,用户查找打开包含某些指定关键字的文档就变得很困难,目前这一问题没有好的解 ...
lucene 实现word，pdf全文检索源码
创建索引: import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import jav ...
Apache Lucene(全文检索引擎)—分词器
目录返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 本项目Demo已上传GitHub,欢迎大家fork下载学习:https://gith ...
全文检索引擎 Solr 部署与基本原理
全文检索引擎 Solr 部署与基本原理搜索引擎Solr环境搭建实例关于 solr , schema.xml 的配置说明全文检索引擎Solr系列-–全文检索基本原理一.搜索引擎Solr环境搭建实 ...
PostgreSQL全文检索zhparser使用
本文引用自: http://blog.chinaunix.net/uid-20726500-id-4820580.html 防止文章丢失才进行复制 PostgreSQL支持全文检索,其内置的缺省的分词 ...
[全文检索]Lucene基础入门.
本打算直接来学习Solr, 现在先把Lucene的只是捋一遍. 本文内容: 1. 搜索引擎的发展史 2. Lucene入门 3. Lucene的API详解 4. 索引调优 5. Lucene搜索结果排 ...
PHP+mysql数据库开发搜索功能：中英文分词+全文检索（MySQL全文检索+中文分词（SCWS））
PHP+mysql数据库开发类似百度的搜索功能:中英文分词+全文检索中文分词: a) robbe PHP中文分词扩展: http://www.boyunjian.com/v/softd/robb ...

随机推荐

#dp#洛谷 4158 [SCOI2009]粉刷匠
题目分析首先每条木板可以分开处理,再合并起来求最大值下面讲一下单独处理每条木板的情况设\(dp[k][m]\)表示前\(m\)个格子粉刷了\(k\)次最多正确粉刷的格子数那么 \[dp[k] ...
深度解析 Spring Security：身份验证、授权、OAuth2 和 JWT 身份验证的完整指南
Spring 安全框架 Spring Security 是一个用于保护基于 Java 的应用程序的框架.它是一个功能强大且高度可定制的身份验证和访问控制框架,可以轻松地集成到各种应用程序中,包括 We ...
部署解压版mysql
1.检查系统是否安装过mysql //检查系统中有无安装过mysql rpm -qa|grep mysql //查询所有mysql 对应的文件夹,全部删除 whereis mysql find / - ...
openGauss共享存储对接Ceph-单机openGauss-Ceph zhangxb2023-02-18
openGauss + DSS + Ceph 部署操作步骤本文档介绍单机版 openGauss+DSS+Ceph 集群部署方式.后续提供主备下的步骤. 服务器: Hostname IP 系统规格 ...
WPF开发随笔收录-获取程序专有内存
分享一个C#获取程序当前所占用的内存大小的方法,实测跟任务管理器上的内存值一样 /// <summary> /// 性能计数器组件类 /// </summary> privat ...
h5py这个坑-PyCharm Process finished with exit code -1073741819 (0xC0000005)
在用pytorch和tensorflow做语音合成时,碰到了个很无解的bug, PyCharm 报错 Process finished with exit code -1073741819 (0xC0 ...
StarRocks 集群安装
当前按照官网上的提供的安装包方式安装,版本是 3.2.2,部署模式为存算一体,安装的操作系统是 Ubuntu 22.04,JDK 版本为 OpenJDK 11,这里选择 3 个节点进行安装,节点的 h ...
ORA-02303: cannot drop or replace a type with type or table dependents，即无法使用类型或表的相关性来删除或取代一个类型
ORA-02303: cannot drop or replace a type with type or table dependents,即无法使用类型或表的相关性来删除或取代一个类型在修改一个 ...
力扣506(java)-相对名次（简单）
题目: 给你一个长度为 n 的整数数组 score ,其中 score[i] 是第 i 位运动员在比赛中的得分.所有得分都互不相同 . 运动员将根据得分决定名次 ,其中名次第 1 的运动员得分最高, ...
基于阿里云GPU云服务器的AIACC助力UC搜索业务性能提效380%，每年节省数千万成本
简介: 用阿里云GPU计算实例来满足UC极致性价比需求文丨阿里云神龙计算平台AI加速团队 & UC搜索架构部推理引擎团队导语:作为国产行列里占有率排名第一的移动浏览器,UC浏览器自身承载着 ...

PageOffice6 实现 word 全文检索

后端代码

前端代码

PageOffice6 实现 word 全文检索的更多相关文章

随机推荐

热门专题