配置微软Azure大数据HDInsight云集群,存储账户、托管标识等问题也都参考官方文档解决了。

原文在我的开源中国博客 https://my.oschina.net/finchxu/blog/3164887

微软Azure为国外学生提供了100美元额度的免费一年的账户,为国内个人用户提供了1500人民币额度的“免费”一个月账户(花费1元即可获得)。

一元体验账户申请链接:https://www.azure.cn/pricing/1rmb-trial-full/?form-type=identityauth

这个账户能使用完整的微软Azure中国区域资源,包括虚拟机、存储、数据分析等。这里直接配置 HDInsight 大数据分析平台。

1. 首先依次找到“创建资源”=>“数据+分析”=>“ HDInsight ”点击进入配置目录。

这里开始第一步,

(1)填写cluster name以方便后来通过web访问你的所有资源。

(2)cluster typer选Hadoop2.7就行。

(3)login name 和密码呢,写好记住就行,也是后边通过web访问的时候要用的。

(4)Resource group你自己新建一个起个名字即可。

(5)地区的话,选择离你近的,中部或者东部都可以。这里要注意,后边别的设置也要选择同样的地区才行。

2. 点击next后进入第二步。配置存储。

我们在创建Azure账户的时候就默认创建了管理员账户,这里还要创建独立的存储账户

(1)首先在左侧边栏找到“存储账户”,右键在新的标签页打开(意思就是不要关闭现有页面)。

这里的资源组填选择和上边第一步中的resource group一样的就行,后边的所有资源也是都选这一个资源组就好了。

点击下一步后,“网络”默认,“高级”中启用“ 层次结构命名空间 ”,后边的就都是默认就行了。最后点击“创建”稍等就完成了。

账户创建完毕了,存储器其实还不能使用,我们需要创建“托管标识”来管理权限问题。

在最上边搜索条中,搜索“托管标识”,如下图所示

点击打开后,选择 添加 即可,这个创建很简单。注意资源组一直都是选同一个,不要新建。

这时候呢,我们把新建的 托管标识 附加到刚才创建的 存储账户 上就完成了。

(1.a)回到 存储账户 页面,点击资源进入详页

(1.b)在左侧边栏找到 “访问控制(标识和访问管理)”

(1.c)点击“添加”=>“添加角色分配”

(1.d)按照下图所示,“角色” 选择 “存储Blob数据所有者”,访问权限 选择 “用户分配的托管标识”,下边自动列出了刚才创建的“托管标识”。这时候选择,并点击保存即可。

(2)这时候回到最开始的页面,也就是 HDInsight 配置页面,我们接着配置第二步。

(2.a)“Primary storage type” 选择 “Azure Date Lake Storage Gen2”

(2.b)下边“select a storage account” 点击选择刚才创建的存储账户即可。

(2.c)这里的Identity就是我们上边创建的 “托管标识”,在“User-assigned managed identity”中选择之前创建好的托管标识就好啦。

    到这里就可以点击next进行下一步了,不过这里的metastore元数据存储可以自定义,这样你的集群被删除的时候,hive元数据都完好无损。

3. 这里来到了最后一步。

这里你会发现为什么费用这么高?别急,我们点击 “Cluster size” 就可以选择节点机器的配置来节省。

在右边窗口点击 浏览全部配置 就可以找到低价的。还有可以设置 “Worker nodes” 的数量,hdfs嘛,最低也要来两台吧,这样hdfs也有100G了。

4. 这时候把剩余的“下一步”点完,就等待他自动创建集群吧,20mins左右完成,回到仪表板就能找到创建好的资源。点击右边的url就能看到所有资源的控制面板了。大功告成。点击url后会提示输入用户名和密码,,这俩就是上边第一步填写的 “cluster login username&password” 还有ssh登录也是上边写好的。

微软大法好!!!微软的文档都写得特别详细完整。这一点微软从来都做的特别厉害!!!

参考文档:

https://docs.microsoft.com/zh-cn/azure/hdinsight/hdinsight-hadoop-provision-linux-clusters

https://docs.microsoft.com/zh-cn/azure/hdinsight/hdinsight-hadoop-use-data-lake-storage-gen2

配置微软Azure大数据HDInsight云集群的更多相关文章

  1. 大数据Hadoop-Spark集群部署知识总结(一)

    大数据Hadoop-Spark集群部署知识总结 一.启动/关闭 hadoop myhadoop.sh start/stop 分步启动: 第一步:在hadoop102主机上 sbin/start-dfs ...

  2. [转]大数据hadoop集群硬件选择

      问题导读 1.哪些情况会遇到io受限制? 2.哪些情况会遇到cpu受限制? 3.如何选择机器配置类型? 4.为数据节点/任务追踪器提供的推荐哪些规格? 随着Apache Hadoop的起步,云客户 ...

  3. 大数据——Hadoop集群坏境CentOS安装

    前言 前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...

  4. 大数据 -- Hadoop集群环境搭建

    首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网 ...

  5. 一台虚拟机,基于docker搭建大数据HDP集群

    前言 好多人问我,这种基于大数据平台的xxxx的毕业设计要怎么做.这个可以参考之前写得关于我大数据毕业设计的文章.这篇文章是将对之前的毕设进行优化. 个人觉得可以分为两个部分.第一个部分就是基础的平台 ...

  6. 部署开启了Kerberos身份验证的大数据平台集群外客户端

    转载请注明出处 :http://www.cnblogs.com/xiaodf/ 本文档主要用于说明,如何在集群外节点上,部署大数据平台的客户端,此大数据平台已经开启了Kerberos身份验证.通过客户 ...

  7. 零基础学习云计算及大数据DBA集群架构师【Linux系统配置及网络配置2015年12月30日周三】

    /Mon *************摘要************** 计划任务 )一次性计划任务 服务:atd 命令:at 服务存放文件:/etc/init.d/atd 系统配置文件:/etc/at. ...

  8. 零基础学习云计算及大数据DBA集群架构师【Linux系统\网络服务及安全配置2015年1月8日周五】

    考试考一天,得分94,最后一题防火墙当时还没搞明白 考题如下: 注意事项: .确保在重启主机后所有配置仍然生效. .selinux 必须为Enforing 模式,防火墙必须开始.默认策略必须清空. . ...

  9. 入门大数据---Redis集群分布式学习

    Redis是什么? 官方介绍: Redis 是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库.缓存和消息中间件. 它支持多种类型的数据结构,如 字符串(strings), 散列( ...

随机推荐

  1. cmake安装mysql及多实例配置方法

    一.安装mysql 1. 生产环境如何选择MySQL版本 1. 选择社区版的稳定GA版本2. 可以选择5.1或5.5.互联网公司主流5.5, 其次是5.1和5.63. 选择发布后6个月以上的GA版4. ...

  2. 从零开始のcocos2dx生活(三)Scheduler

    文章目录 取模 Timer() 变量 设置定时器Timer() 一些成员函数 Scheduler() 变量 初始化 哈希表 构造函数schedule() 开启定时器Update() 析构函数~Upda ...

  3. 【题解】P4755 Beautiful Pair(启发式合并的思路+分治=启发式分治)

    [题解]P4755 Beautiful Pair upd: 之前一个first second烦了,现在AC了 由于之前是直接抄std写的,所以没有什么心得体会,今天自己写写发现 不知道为啥\(90\) ...

  4. zabbix安装和使用

    前言:zabbix是一款很好用的监控工具,相比nagios(也是监控工具的一种)而言,zabbix提供了强大的视图界面,操作简单,功能强大,只需在页面配置即可,让你用的开心,回家放心. zabbix监 ...

  5. Django常用字段及参数、事务、数据库查询优化

    常用字段 注意: Django中没有设置对应char类型的字段,但可以支持自己定义. 自定义对应于数据库的char类型字段: from django.db.models import Field cl ...

  6. schedule of 2016-09-19~2016-09-25(Monday~Sunday)——1st semester of 2nd Grade

    2016/9/19 Monday 1.make ppt for today's group meeting 2.recite 100 words 3.review <图解机器学习>ch1~ ...

  7. .NET Core学习笔记(3)——async/await中的Exception处理

    在写了很多年.NET程序之后,年长的猿类在面对异步编程时,仍不时会犯下致命错误,乃至被拖出去杀了祭天.本篇就async/await中的Exception处理进行讨论,为种族的繁衍生息做出贡献……处理a ...

  8. Js字符串按数量分组

    代码: function group(ss,step) { var r = []; function doGroup(s) { if (!s) return; r.push(s.substr(0, s ...

  9. cogs 1176. [郑州101中学] 月考 Map做法

    1176. [郑州101中学] 月考 ★★☆   输入文件:mtest.in   输出文件:mtest.out   简单对比时间限制:1 s   内存限制:128 MB [题目描述] 在上次的月考中B ...

  10. 【ARM】---关于ARM内核与架构的解释

    本文摘自某论坛某位大神的一段回复,经典至极,copy来己用! 只要你玩过ARM内核的芯片,那么关于内核和架构,我想应该或多或少的困惑过你,看了下面的介绍,你应该会清楚很多! 好比你盖房子,刚开始因为水 ...