kafka.utils.Utils阅读

这个类实现了一些工具性质的方法，正如其名。

记下自己觉得有意思的方法：

readFileAsString(path: String, charset: Charset = Charset.defaultCharset()): String

  /**

   * Attempt to read a file as a string

   */

  def readFileAsString(path: String, charset: Charset = Charset.defaultCharset()): String = {

    val stream = new FileInputStream(new File(path))

    try {

      val fc = stream.getChannel()

      val bb = fc.map(FileChannel.MapMode.READ_ONLY, 0, fc.size())

      charset.decode(bb).toString()

    }

    finally {

      stream.close()

    }

  }

　　这里特殊之处是使用了NIO里FileChannel的内存映射，对目标文件建立内存映射。然后对返回的MappedByteBuffer进行解码, 得到CharBuffer, 然后调用其toString方法获得对应的字符串。

　　当处理比较大的文件时，内存映射会带来性能的提升。同时，将整个文件读进一个大的ByteBuffer，然后由这个ByteBuffer进行字符解码，可以直接得到整个文件对应的字符串。同样的功能也可以用FileInputReader的read方法实现。所以，主要考虑还是内存映射。

引用

从代码层面上看，从硬盘上将文件读入内存，都要经过文件系统进行数据拷贝，并且数据拷贝操作是由文件系统和硬件驱动实现的，理论上来说，拷贝数据的效率是一样的。但是通过内存映射的方法访问硬盘上的文件，效率要比read和write系统调用高，这是为什么呢？原因是read()是系统调用，其中进行了数据拷贝，它首先将文件内容从硬盘拷贝到内核空间的一个缓冲区，如图2中过程1，然后再将这些数据拷贝到用户空间，如图2中过程2，在这个过程中，实际上完成了两次数据拷贝；而mmap()也是系统调用，如前所述，mmap()中没有进行数据拷贝，真正的数据拷贝是在缺页中断处理时进行的，由于mmap()将文件直接映射到用户空间，所以中断处理函数根据这个映射关系，直接将文件从硬盘拷贝到用户空间，只进行了一次数据拷贝。因此，内存映射的效率要比read/write效率高。

实际上内存映射就是磁盘的数据会被直接写到用户空间(在内存中)；而不用内存映射会先写到内核缓冲，再由CPU拷贝到用户空间，这样就慢了。

Java 中使用内存映射文件需要考虑的 10 个问题

circularIterator[T](coll: Iterable[T])

 /**

   * Create a circular (looping) iterator over a collection.

   * @param coll An iterable over the underlying collection.

   * @return A circular iterator over the collection.

   */

  def circularIterator[T](coll: Iterable[T]) = {

    val stream: Stream[T] =

      for (forever <- Stream.continually(1); t <- coll) yield t

    stream.iterator

  }

　　这方法构造了一个对指定集合的无穷迭代器。利用了Scala的特殊的for循环和Stream的continually方法。Stream.containually(1)会构造一个全是1组成的流，由于这个流是无穷的，所以t <- coll在遍历完集合以后，会继续无穷次地遍历它。通过yeild，生成了一个流。如，集合是1 to 100，那么这个流就是 1，2，3,..., 100, 1,2,...,100,1,2,...,100,1,2,...

kafka.utils.Utils阅读的更多相关文章

duilib\utils\utils.h(251) : error C2504: “VARIANT”: 未定义基类
转载:http://blog.csdn.net/SP_daiyq/article/details/44542939?locationNum=3 创建win32应用程序的工程文件,删除不需要的代码,只留 ...
Kafka 权威指南阅读笔记（第三章，第四章）
Kafka 第三章,第四章阅读笔记 Kafka 发送消息有三种方式:不关心结果的,同步方式,异步方式. Kafka 的异常主要有两类:一种是可重试异常,一种是无需重试异常. 生产者的配置: acks ...
Kafka权威指南阅读笔记（第八章）
跨集群数据镜像使用场景: 区域集群和中心集群这种场景下,每个区域的应用程序只访问相应的区域内的集群.而有些情况下,需要将各个集群的信息汇总到中心集群,就可以用中心集群分析业务数据了. 冗余一个K ...
Kafka权威指南阅读笔记（第六章）
Broker配置 Kafka可以同时拥有可靠的主题和非可靠的主题.非可靠的主题允许丢失. 复制系数主题级别的配置参数是 replication.factor,在Broker级别则可以通过defaul ...
Kafka权威指南阅读笔记（第五章）
Kafka Broker kafka 第一个启动的Broker在ZooKeeper中创建一个临时节点/controller,让自己成为控制器.其他Broker启动后在控制器节点上创建Watch对象,便 ...
模块工具类--utils
File: js\utils.js/** * 模块工具类,用来初始化各模块视图.自定绑定事件以及其他辅助功能等 * @class Utils */Utils = (function() { var i ...
Flume+Kafka+Strom基于伪分布式环境的结合使用
目录: 一.Flume.Kafka.Storm是什么,如何安装? 二.Flume.Kafka.Storm如何结合使用? 1) 原理是什么? 2) Flume和Kafka的整合 3) Kafka和St ...
实践部署与使用apache kafka框架技术博文资料汇总
前一篇Kafka框架设计来自英文原文(Kafka Architecture Design)的翻译及整理文章,非常有借鉴性,本文是从一个企业使用Kafka框架的角度来记录及整理的Kafka框架的技术资料 ...
翻译 - Kafka Streams 介绍(一)
2019独角兽企业重金招聘Python工程师标准>>> 资料 [原文地址](http://kafka.apache.org/11/documentation/streams/) 正文 ...

随机推荐

解析LRC歌词文件readlrc
package com.jikexueyuan.readlrc.main; import com.jikexueyuan.readlrc.utils.Utils; import java.io.Fil ...
BLK-MD-BC04-B蓝牙模块开发说明
BLK-MD-BC04-B蓝牙模块开发说明日期:2011-9-24 浏览次数:4178 BLK-MD-BC04-B蓝牙通信模块, BLK-MD-BC04-B蓝牙通信模块为本公司自主开发的智 ...
利用google api生成二维码名片例子
二维条码/二维码可以分为堆叠式/行排式二维条码和矩阵式二维条码.堆叠式/行排式二维条码形态上是由多行短截的一维条码堆叠而成:矩阵式二维条码以矩阵的形式组成,在矩阵相应元素位置上用“点”表示二进制“1” ...
MVC5----用户登陆及验证码
随便写写记录一下学习的过程登陆 Models中添加添加 public class LoginViewModel { [Required(ErrorMessage = "*")] ...
本招聘信息2014年长期有效！杭州派尔科技高薪诚聘android开发（10K-20K），web前端开发（8K-15K），IOS开发（15K-25K）
杭州派尔科技有限公司发展至今,离不开员工的无私奉献和辛勤耕耘,在努力创造更好成绩的同时,公司也不忘回馈每一位员工的努力与付出.1.全面的绩效考核机制,让发展空间近在眼前!公司力争让每一位员工都了解自己 ...
如何在UINavigationBar上添加UISearchBar以及UISearchDisplayController的使用 --OC --iOS
那我们开始吧,下面是Sely写的一个Demo,分享给大家. 新建一个项目, UISearchDisplayController 的 displaysSearchBarInNavigationBar太死 ...
用sinopia搭建npm私服
需求(这段话是摘抄参考文档的,因为作者也想这么说): 公司出于自身隐私保护需要,不想把自己的代码开源到包管理区,但是又急需一套完整包管工具,来管理越来越多的组件.模块和项目.对于前端,最熟悉的莫过于n ...
docker & nodejs
Docker 部署 Node js demo程序 1.准备node js程序,使用express框架. mkdir demo 在demo文件夹下建立package.json { "name& ...
js实现跨域(jsonp, iframe+window.name, iframe+window.domain, iframe+window.postMessage)
一.浏览器同源策略首先我们需要了解一下浏览器的同源策略,关于同源策略可以仔细看看知乎上的一个解释.传送门总之:同协议,domain(或ip),同端口视为同一个域,一个域内的脚本仅仅具有本域内的权限 ...
最全 Adobe 系列产品 CS6版本序列号/注册码
最全 Adobe 系列产品 CS6版本序列号/注册码: 1.Adobe Photoshop CS6 Extended 序列号/注册码 2.Adobe After Effects CS6 序列号/注册 ...

kafka.utils.Utils阅读

kafka.utils.Utils阅读的更多相关文章

随机推荐

热门专题