如何缓存hbase数据以减少下次取数据的时间

缓存从hbase取得的数据的好处是显而易见的，缓存到本地以后，如果下次的输入能够直接从已缓存的本地文件中取得数据就无需再次访问hbase数据库，这样一来数据量大的话可以节省大量的访问hbase数据库的时间。

 function enterSearch(plate)

     {

         searchPlateBegin = new Date();

         var plateArray = new Array();

         var convertReverseArray = new Array();

         if(regex_cache[plate] == null)

         {

             var strRegEx = convertInput(plate);

             var regEx = new RegExp(strRegEx);

             regEx.compile(regEx);

             for (var i = 0;i < keyArrayConvert.length;i++)

             {

                 if (regEx.test(keyArrayConvert[i]))

                 {

                     convertReverseArray.push(keyArray[i]);

                     plateArray.push(keyArrayConvert[i]);

                 }

             }

             var cacheFileName = (++write_regex_cache_count).toString() + ".json";

             fs.writeFile("./cache/"+cacheFileName,JSON.stringify(convertReverseArray),function(err){

                 if(err) throw err;

                 regex_cache[plate] = "./cache/"+cacheFileName;

             });

             var cacheFileName_convert = (++write_regex_cache_count_convert).toString() + "_decoded.json";

             fs.writeFile("./cache/"+cacheFileName_convert,JSON.stringify(plateArray),function(err){

                 if(err) throw err;

                 regex_cache_convert[plate] = "./cache/"+cacheFileName_convert;

             });

             searchPlateEnd  = new Date();

         }

         else

         {

             searchPlateEnd  = new Date();

             convertReverseArray = JSON.parse(fs.readFileSync(regex_cache[plate],'utf8'));

             plateArray = JSON.parse(fs.readFileSync(regex_cache_convert[plate],'utf8'));

         }

在这里就是做了一个缓存，把convertReverseArray以不同的文件名的形式缓存到cache目录下。每输入一个plate，先去到regex_cache[plate]中寻找有无数据，如果没有数据说明本地没有相对应的数据，就会调用正则表达式从keyArrayConvert中找到相匹配的数据放至regex_cache[plate]中，如果该数据已存在说明本地文件已有该数据，这是跳到else语句执行相关的操作，如果keyArrayConvert包含的数据巨大的话，采用这种方式可以节省大量时间。

如何缓存hbase数据以减少下次取数据的时间的更多相关文章

highcharts图表的上钻下钻，下钻数据，与回取数据
通常图表在下钻之后,会点返回,返回之后,可能需要调用上钻回调事件,在drillup事件里获取上钻数据,然后对需要联动进行操作: chart: { type: 'column', events: { d ...
scrapy过滤重复数据和增量爬取
原文链接前言这篇笔记基于上上篇笔记的---<scrapy电影天堂实战(二)创建爬虫项目>,而这篇又涉及redis,所以又先熟悉了下redis,记录了下<redis基础笔记> ...
m_Orchestrate learning system---三十五、php数据和js数据的解耦：php数据（php代码）不要放到js代码中
m_Orchestrate learning system---三十五.php数据和js数据的解耦:php数据(php代码)不要放到js代码中一.总结一句话总结:也就是以html为中介,用html ...
HBase指定大量列集合的场景下并发拉取数据时卡住的问题排查
最近遇到一例,HBase 指定大量列集合的场景下,并发拉取数据,应用卡住不响应的情形.记录一下. 问题背景退款导出中,为了获取商品规格编码,需要从 HBase 表 T 里拉取对应的数据. T 对商品 ...
NET 5 爬虫框架/抓取数据
爬虫大家或多或少的都应该接触过的,爬虫有风险,抓数需谨慎. 爬虫有的是抓请求,有的是抓网页再解析本着研究学习的目的,记录一下在 .NET Core 下抓取数据的实际案例.爬虫代码一般具有时效性,当 ...
windows环境下nutch2.x 在eclipse中实现抓取数据存进mysql详细步骤
nutch2.x 在eclipse中实现抓取数据存进mysql步骤最近在研究nutch,花了几天时间,也遇到很多问题,最终结果还是成功了,在此记录,并给其他有兴趣的人提供参考,共同进步. 对nutc ...
借助Chrome和插件爬取数据
工具 Chrome浏览器 TamperMonkey ReRes Chrome浏览器 chrome浏览器是目前最受欢迎的浏览器,没有之一,它兼容大部分的w3c标准和ecma标准,对于前端工程师在开发过程 ...
SQL反模式学习笔记18 减少SQL查询数据，避免使用一条SQL语句解决复杂问题
目标:减少SQL查询数据,避免使用一条SQL语句解决复杂问题反模式:视图使用一步操作,单个SQL语句解决复杂问题使用一个查询来获得所有结果的最常见后果就是产生了一个笛卡尔积.导致查询性能降低. 如 ...
Python分页爬取数据的分析
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 向右奔跑 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...

随机推荐

模块化开发(seajs)
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
doT.js-doT模板方便快捷的组织页面DOM
重来没有想过,作为一个坐吃等死的前端也会有学习引擎模板的一天都是被现实所逼呀.学习优秀代码时,一句一句翻译.忽然看到{{ }}这个包裹的代码.糟心了!看不懂,咋办?学呀!!!!!! 这是我开始学 ...
TF-IDF 学习
参考资料, 阮一峰的博客 http://www.ruanyifeng.com/blog/2013/03/tf-idf.html 非常感谢他, 能用如此通俗易懂的文字来阐述概念 TF -- Term ...
Java 基础【04】数组内存分配
可能Java 数组大家都很熟悉,最近我遇到了一个关于Java 数组内存分配的问题. 突然发现许多书上“基本数据类型存储在栈内存当中,对象则保存在堆内存”这句话完全是错误的.下面是个简单的例子代码: p ...
HDU 5733 tetrahedron（计算几何）
题目链接 tetrahedron 题目大意输入一个四面体求其内心,若不存在内心则输出"O O O O" 解题思路其实这道题思路很简单,只要类推一下三角形内心公式就可以了. 至于 ...
Xamarin XAML语言教程使用Visual Studio创建XAML
Xamarin XAML语言教程使用Visual Studio创建XAML Xamarin.Forms允许开发人员通过XAML语法对程序的所有用户界面元素进行详细的定制,如文本.按钮.图像和列表框等. ...
SSL剥离工具sslstrip
SSL剥离工具sslstrip 在日常上网过程中,用户只是在地址栏中输入网站域名,而不添加协议类型,如HTTP和HTTPS.这时,浏览器会默认在域名之前添加http://,然后请求网站.如果网站采 ...
TF-IDF学习笔记
计算文本的权重向量,有个很有效的权重方案:TF-IDF权重策略.TF-IDF含义是词频逆文档频率,指的是,如果某个词或短语在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为此词或短语具有很好的 ...
php实现类似淘宝最近浏览商品的功能模型代码
<?php //TempNum 显示临时记录数 $TempNum=5; //setcookie("RecentlyGoods", "12,31,90,39" ...
HDU 2102 A计划（BFS）
A计划 Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submiss ...

如何缓存hbase数据以减少下次取数据的时间

如何缓存hbase数据以减少下次取数据的时间的更多相关文章

随机推荐

热门专题