前期博客

hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz + zeppelin-0.5.6-incubating-bin-all.tgz(master、slave1和slave2)(博主推荐)(图文详解)

hadoop-2.7.3.tar.gz + spark-2.0.2-bin-hadoop2.7.tgz + zeppelin-0.6.2-incubating-bin-all.tgz(master、slave1和slave2)(博主推荐)(图文详解)

测试

  • 配置Spark解释器

  • 创建Note

运行官网的例子:

然后我们点Notebook->Zeppelin Tutorial

然后点击save

然后在最上面的部分点击如下图所示的位置:

运行结果在截取两张图给大家:

  最后一个要注意的是,这是我自己摸索着搞得,有问题发生是正常的,所以标题加上了初探两个字!

  

ml-100k推荐数据集的下载

  官网

https://grouplens.org/datasets/movielens/

  因为,这里,考虑到测试入门而已。只要跑通,数据量大小其次。所以,选择下载ml-100k。

[hadoop@master data]$ pwd
/home/hadoop/data
[hadoop@master data]$ ll
total 24
drwxrwxr-x 5 hadoop hadoop 4096 Apr 21 15:25 es
drwxrwxr-x 5 hadoop hadoop 4096 Apr 20 15:19 flume
drwxrwxr-x 2 hadoop hadoop 4096 May 3 15:58 jar
drwxrwxr-x 5 hadoop hadoop 4096 Jul 28 08:48 storm
drwxrwxr-x. 3 hadoop hadoop 4096 Apr 20 10:28 tmp
drwxrwxr-x. 4 hadoop hadoop 4096 Apr 12 16:13 zookeeper
[hadoop@master data]$ mkdir zeppelin
[hadoop@master data]$ ll
total 28
drwxrwxr-x 5 hadoop hadoop 4096 Apr 21 15:25 es
drwxrwxr-x 5 hadoop hadoop 4096 Apr 20 15:19 flume
drwxrwxr-x 2 hadoop hadoop 4096 May 3 15:58 jar
drwxrwxr-x 5 hadoop hadoop 4096 Jul 28 08:48 storm
drwxrwxr-x. 3 hadoop hadoop 4096 Apr 20 10:28 tmp
drwxrwxr-x 2 hadoop hadoop 4096 Sep 2 10:12 zeppelin
drwxrwxr-x. 4 hadoop hadoop 4096 Apr 12 16:13 zookeeper
[hadoop@master data]$

[hadoop@master zeppelin]$ pwd
/home/hadoop/data/zeppelin
[hadoop@master zeppelin]$ ll
total 0
[hadoop@master zeppelin]$ wget http://files.grouplens.org/datasets/movielens/ml-100k.zip
--2017-09-02 10:15:32-- http://files.grouplens.org/datasets/movielens/ml-100k.zip
Resolving files.grouplens.org... 128.101.34.235
Connecting to files.grouplens.org|128.101.34.235|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 4924029 (4.7M) [application/zip]
Saving to: “ml-100k.zip” 100%[=====================================================================================================================================================>] 4,924,029 238K/s in 19s 2017-09-02 10:15:53 (248 KB/s) - “ml-100k.zip” saved [4924029/4924029] [hadoop@master zeppelin]$ ll
total 4812
-rw-rw-r-- 1 hadoop hadoop 4924029 Jan 30 2016 ml-100k.zip
[hadoop@master zeppelin]$

  创建完成后就可以看到ml-100k页面,单击Zeppelin可以回到首页。

  回到Zeppelin首页,就可以看到如下图的页面。

  或者

http://192.168.80.145:8099/#/

Zeppelin的入门使用系列之创建新的Notebook的更多相关文章

  1. Zeppelin的入门使用系列之创建新的Notebook(一)

    不多说,直接上干货! 前期博客 hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz + zeppelin-0.5.6-incubating-bin- ...

  2. Zeppelin的入门使用系列之使用Zeppelin运行shell命令(二)

    不多说,直接上干货! 前期博客 Zeppelin的入门使用系列之创建新的Notebook(一) 接下来,我将以ml-100k数据集,示范如何使用Spark SQL进行数据分析与数据可视化 因为 [ha ...

  3. Zeppelin的入门使用系列之使用Zeppelin来创建临时表UserTable(三)

    不多说,直接上干货! 前期博客 Zeppelin的入门使用系列之使用Zeppelin运行shell命令(二) 我们必须要先使用Spark 语句创建临时表UserTable,后续才能使用Spark SQ ...

  4. Zeppelin的入门使用系列之使用Zeppelin来运行Spark SQL(四)

    不多说,直接上干货! 前期博客 Zeppelin的入门使用系列之使用Zeppelin来创建临时表UserTable(三) 1. 运行年龄统计的Spark SQL (1)  输入Spark SQL时,必 ...

  5. Windows Azure入门教学系列 (一): 创建第一个WebRole程序

    原文 Windows Azure入门教学系列 (一): 创建第一个WebRole程序 在第一篇教学中,我们将学习如何在Visual Studio 2008 SP1中创建一个WebRole程序(C#语言 ...

  6. WPF入门教程系列(一) 创建你的第一个WPF项目

    WPF入门教程系列(一) 创建你的第一个WPF项目 WPF基础知识 快速学习绝不是从零学起的,良好的基础是快速入手的关键,下面先为大家摞列以下自己总结的学习WPF的几点基础知识: 1) C#基础语法知 ...

  7. Windows Azure中文博客 Windows Azure入门教学系列 (一): 创建第一个WebRole程序

    http://blogs.msdn.com/b/azchina/ 本文转自:http://blogs.msdn.com/b/azchina/archive/2010/02/09/windows-azu ...

  8. Lucene.net入门学习系列(1)

    Lucene.net入门学习系列(1)   Lucene.net入门学习系列(1)-分词 Lucene.net入门学习系列(2)-创建索引 Lucene.net入门学习系列(3)-全文检索 这几天在公 ...

  9. Lucene.net入门学习系列(2)

    Lucene.net入门学习系列(2) Lucene.net入门学习系列(1)-分词 Lucene.net入门学习系列(2)-创建索引 Lucene.net入门学习系列(3)-全文检索 在使用Luce ...

随机推荐

  1. Creo二次开发--内存清理函数

    我们在处理模型文件时,总会遇到内存环境的清除问题.一个干净的Creo工作环境.是保证工作能顺利完毕的保障. ProMdlEraseNotDisplayed()函数提供了清除未显示模型的功能. 当须要循 ...

  2. Mysql 数据库中间件

    读写分离:简单的说是把对数据库读和写的操作分开对应不同的数据库服务器,这样能有效地减轻数据库压力,也能减轻io压力.主数据库提供写操作,从数据库提供读操作,其实在很多系统中,主要是读的操作.当主数据库 ...

  3. mysql limit分页优化方法分享

    同样是取10条数据  select * from yanxue8_visit limit 10000,10 和  select * from yanxue8_visit limit 0,10  就不是 ...

  4. WPF新手之如何将数据绑定到TreeView

    看过许多例子,全是绑定到类的,没人说如何绑定到某个对象,偏偏我这个绝对的新手就是要绑定到一个对象,只能自己摸索了: 首先要将数据绑定到容器,有以下几个默认条件:①元数据必须包装在List或者Obser ...

  5. OpenCV2.3.1在CentOS6.5下的安装

    安装的linux版本号是centos6.5.选择的是opencv2.3.1.不是非常新的版本号. 由于在安装opencv2.4.9的时候.make的过程中出现了问题. 一:安装依赖包 依赖包用yum安 ...

  6. POJ 2892 Tunnel Warfare(树状数组+二分)

    题目链接 二分求上界和下界,树状数组.注意特殊情况. #include <cstring> #include <cstdio> #include <string> ...

  7. 新产品为了效果,做的比較炫,用了非常多的图片和JS,所曾经端的性能是非常大的问题,分篇记录前端性能优化的一些小经验。

    第一篇:HTTPserver 因tomcat处理静态资源的速度比較慢,所以首先想到的就是把全部静态资源(JS,CSS,image,swf) 提到单独的server,用更加高速的HTTPserver,这 ...

  8. Duplicate Observed Data

    在翻看<重构-改善既有代码的设计>这本经典的书,书中就介绍了一个重构方法--Duplicate Observed Data 复制被监视数据的重构方法,使用这种方法能够使界面和对数据的操作隔 ...

  9. ⭐register_chrdev、register_chrdev_region以及alloc_chrdev_region之间的区别

    register_chrdev:Linux2.6.30之前所用,不用定义cdev:但 如果是register_chrdev 注册的话,这个时候,分配的次设备号,是从0~255,这样子的话,就分配的范围 ...

  10. local_irq_disable

    local_irq_disable 仅仅是 设置 当前CPU 的中断屏蔽位 disable_irq 是禁用 全部cpu 中断(只是当前irq) 如果你要禁止所有的中断该怎么办? 在2.6内核中,可以通 ...