1.概述

  大数据时代,数据的存储与挖掘至关重要。企业在追求高可用性、高扩展性及高容错性的大数据处理平台的同时还希望能够降低成本,而Hadoop为实现这些需求提供了解决方案。面对Hadoop的普及和学习热潮,笔者愿意分享自己多年的开发经验,带领读者比较轻松地掌握Hadoop数据挖掘的相关知识。这边是笔者编写本书的原因。本书使用通俗易懂的语言进行讲解,从基础部署到集群管理,再到底层设计等内容均由涉及。通过阅读本书,读者可以较为轻松地掌握Hadoop大数据挖掘与分析的相关技术。

  本书目前已在网上商城上架,可以通过京东自营当当自营亚马逊自营等网上商城进行购买。书籍封面如下:

2.本书内容

  本书采用“理论+实战”的形式编写,通过大量的实例,结合作者多年一线开发实战经验,全面的介绍了Hadoop的使用方法。全书设计秉承方便学习、易于理解、便于查询的理念,无论是刚入门的初学者系统的学习Hadoop的基础知识,还是拥有多年开发经验的开发者想学习Hadoop,都能通过本书迅速掌握Hadoop的各种基础语法和实战技巧。本书作者曾经与极客学院合作,拥有丰富的教学视频制作经验,为读者精心录制了详细的视频介绍。本书还免费提供所有案例的源码,为读者的学习和工作提供更多的便利。

本书分为13章,分别介绍Hadoop平台管理与维护、异常处理解决方案以及Hadoop的分布式文件系统等内容。最后一章对Hadoop进行了拓展,剖析了Kafka消息系统并介绍了笔者的开源监控系统Kafka Eagle。

本书结构清晰、案例丰富、通俗易懂、实用性强。特别适合初学者自学和进阶读者查询及参考。另外,本书也适合社会培训学校作为培训教材使用,还适合大中专院校的相关专业作为教学参考书。

3.本书特色

3.1 提供专业的配套教学视频,高效、直观

  笔者曾接受过极客学院的专业视频制作指导,并在极客学院录制过多期Hadoop和Kafka实战教学视频课程,得到了众多学习者的青睐及好评。为了便于读者更加高效、直观地学习本书内容,笔者特意为本书实战部分的内容录制了配套教学视频,读者可以在教学视频的辅助下学习,从而更加轻松地掌握Hadoop。

3.2 来自一线的开发经验及实战例子

  本书给出的代码讲解和实例大多数来自于笔者多年的教学积累和技术分享,几乎都是得到了学习者一致好评的干活。另外,笔者还是一名开源爱好者,编写了业内著名的Kafka Eagle监控系统。本书第13章介绍了该系统的使用,以帮助读者掌握如何监控大数据集群的相关知识。

3.3 浅显易懂的语言、触类旁通的对比、循序渐进的知识体系

  本书在文字及目录编排上,尽量做到通俗易懂。在讲解一些常见的知识点时,将Hadoop命令与Linux命令做对比,掌握Linux命令的开发者能够迅速掌握Hadoop的操作命令。无论是初学者,还是久经沙场的老程序员都能快速通过本书学习Hadoop的精华之处。

3.4 内容全面,实用性强

  本书精心挑选了多个实用性很强的例子,例如:Hadoop套件实战、Hive 编程、Hadoop平台管理与维护、ELK实战、Kafka实战等。读者既可以从例子中学习并理解Hadoop及其套件知识点,还可以将这些例子用于开发中。

4. 示例代码

  本书的所有示例都封装在该项目中,读者可以下载该工程的源代码来对照书中的内容进行学习。由于本工程采用的是Maven来进行管理,所以在需要编译打包时,可以直接只用mvn命令,或者执行./build.sh脚本来实现打包。

5. 书籍目录部分预览

6. 读者对象

  学习Hadoop没有想象中的那么困难,本书通过将一些Hadoop难懂的知识点,通过通俗易懂的语言进行概述,来减少读者的学习成本,让读者轻轻松松地掌握Hadoop的相关知识。适用范围但不仅仅包含以下:

  • Hadoop初学者
  • Hadoop进阶人员
  • 后端程序初学者
  • 前端转后端的开发人员
  • 熟悉Linux操作系统以及有编程语言基础的
  • 学习Hadoop的编程爱好者

7. 总结

  最后,衷心希望笔者编写的这本书能够帮助到对Hadoop感兴趣、学习Hadoop的同学。希望阅读过本书的同学能够掌握Hadoop相关知识,希望笔者书中的经验和总结能够帮助读者少走弯路,在Hadoop学习之路上游刃有余。

8.结束语

  感兴趣的同学可以购买本书,如果在学习本书的内容中遇到任何疑问,可以通过下面的联系方式进行邮件留言或者加入Hadoop学习讨论群,笔者会尽我所能,帮您解答,与君共勉!

Hadoop大数据挖掘从入门到进阶实战的更多相关文章

  1. [Hadoop大数据]--kafka入门

    问题导读: 1.zookeeper在kafka的作用是什么? 2.kafka中几乎不允许对消息进行“随机读写”的原因是什么? 3.kafka集群consumer和producer状态信息是如何保存的? ...

  2. Hadoop大数据平台入门——HDFS和MapReduce

    随着硬件水平的不断提高,需要处理数据的大小也越来越大.大家都知道,现在大数据有多火爆,都认为21世纪是大数据的世纪.当然我也想打上时代的便车.所以今天来学习一下大数据存储和处理. 随着数据的不断变大, ...

  3. Kubernetes 从入门到进阶实战教程 (2021 最新万字干货版)

    作者:oonamao 毛江云,腾讯 CSIG 应用开发工程师原文:来源腾讯技术工程,https://tinyurl.com/ya3ennxf 写在前面 笔者今年 9 月从端侧开发转到后台开发,第一个系 ...

  4. Hadoop大数据初入门----haddop伪分布式安装

    一.hadoop解决了什么问题 hdfs 解决了海量数据的分布式存储,高可靠,易扩展,高吞吐量mapreduce 解决了海量数据的分析处理,通用性强,易开发,健壮性 yarn 解决了资源管理调度 二. ...

  5. Flutter从入门到进阶实战携程网App_汇总贴

    视频地址:https://coding.imooc.com/class/321.html?mc_marking=60e5294c605a87b2af7257d06f70505e&mc_chan ...

  6. Hadoop大数据零基础高端实战培训系列配文本挖掘项目

  7. 深入浅出Hadoop Mahout数据挖掘实战(算法分析、项目实战、中文分词技术)

    Mahout简介 Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目, 提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建 ...

  8. 顶尖大数据挖掘实战平台(TipDM-H8)产品白皮书

        顶尖大数据挖掘实战平台 (TipDM-H8)           产  品  说  明  书 广州泰迪智能科技有限公司 版权所有 地址: 广州市经济技术开发区科学城232号 网址: http: ...

  9. 【Python高级工程师之路】入门+进阶+实战+爬虫+数据分析整套教程

    点击了解更多Python课程>>> 全网最新最全python高级工程师全套视频教程学完月薪平均2万 什么是Python? Python是一门面向对象的编程语言,它相对于其他语言,更加 ...

随机推荐

  1. margin-top的兼容问题

    产生的条件:子元素给了margin-top,并且父元素没有浮也没有其他样式,浏览器解析的结果是父元素下去了. 解决方法:1.给子元素或者父元素添加浮动,缺点:如果不需要浮动,添加浮动也页面布局会乱 2 ...

  2. Python爬虫开发与项目实战

    Python爬虫开发与项目实战(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1MFexF6S4No_FtC5U2GCKqQ 提取码:gtz1 复制这段内容后打开百度 ...

  3. 阿里云消息队列(MQ)服务

    A.首先在阿里云上申请消息队列MQ服务: B.然后创建一个Topic(主题,一级主题):然后创建生产者与消费者: C.不过此时还没有结束 ,还需要创建一个AccessKey和AccessSecret( ...

  4. [JZOJ3588]【中山市选2014】J语言(表达式解析+栈)

    Description J语言作为一门编程语言,诞生于20世纪90年代.............. 好学的小H今天又学到了一种新东西——J语言.显然,J语言的背景已经被小H忘得一干二净了,但是小H仍然 ...

  5. 百度语音合成AI

    注意:不要使用Dw编辑PHP代码,会因为编码问题出错!!<?php require_once 'AipSpeech.php'; // 你的 APPID AK SK const APP_ID = ...

  6. NOIP-接水问题

    题目描述 学校里有一个水房,水房里一共装有m个龙头可供同学们打开水,每个龙头每秒钟的供水量相等,均为1. 现在有n名同学准备接水,他们的初始接水顺序已经确定.将这些同学按接水顺序从1到n编号,i号同学 ...

  7. 修改 Docker 的 daemon.json后启动失败

    创建Harbor要把register 换成Harbor地址 vim /etc/docker/daemon.json添加{ "insecure-registries":[" ...

  8. OpenCV常用头文件介绍

    转载:https://www.cnblogs.com/wangguchao/p/7244483.html 1.OpenCV包含的模块 cv – 核心函数库 cvaux – 辅助函数库 cxcore – ...

  9. Bandwagon的配置记录(一) —— kexue上网

    写在前面 这是kexue上网的一种方法. 看文章前,先拉最底下,看一遍“写在最后”. 租个服务器 我租了个洛杉矶的服务器,系统是ubuntu16.04 x86_64 进入KiwiVM Control ...

  10. 【DFS】求水洼的数目

    题目: 有一个大小为 N*M 的园子,雨后积起了水.八连通的积水被认为是连接在一起的.请求出园子里总共有多少水洼?(八连通指的是下图中相对 W 的*的部分) *** *W* *** 限制条件:N, M ...