1) 关于hadoop在eclipse插件。经过自己的摸爬滚打。总结一下三条。

    a) 2.0或者0.23.0吧 google比较方便。其他的可以自己编译。(这个我不敢保证。我本地环境事2.1.0。就是google上搜到的,都是可以自己编的,听说2.0源代码里面也有。但是我没有找到)

    b)2.0以后的,特别的是2.1.0的。人家独立了一个项目,叫做HDT。还在开发中。这个是项目网址

http://hdt.incubator.apache.org/

    c) 感觉上,如果mapperreduce其实可以再本机跑,纯调试用。然后接一个分布式的hdfs即可。因为我刚学吗,而且是自学。也不敢保证。

        总之是。我理论猜测为先,想想mapperreduce,其实也就是一个java程序。然后亲身试验了一下。发现居然行。估计着,mapreduce其实跑的就是本地一个单线程的程序,多线程也算不上,更别谈分布式了。有其形,而无其实。

        项目中。maven的dependency。

                        <!-- hadoop -->

                                <dependency>

                                                <groupId>org.apache.hadoop</groupId>

                                                <artifactId>hadoop-common</artifactId>

                                                <version>${hadoop.version}</version>

                                </dependency>

                    <dependency>

                                    <groupId>org.apache.hadoop</groupId>

                                    <artifactId>hadoop-hdfs</artifactId>

                                    <version>${hadoop.version}</version>

                                </dependency>

                                <dependency>

                                    <groupId>org.apache.hadoop</groupId>

                                    <artifactId>hadoop-yarn-common</artifactId>

                                    <version>${hadoop.version}</version>

                    </dependency>

                                <dependency>

                                  <groupId>org.apache.hadoop</groupId>

                                  <artifactId>hadoop-mapreduce-client-app</artifactId>

                                  <version>2.1.0-beta</version>

                                </dependency>

                                <dependency>

                                    <groupId>org.apache.hadoop</groupId>

                                    <artifactId>hadoop-auth</artifactId>

                                    <version>2.1.0-beta</version>

                                </dependency>

                <!-- hadoop -->

2)管理的web页面

http://master:18088/cluster/scheduler

http://master:23001/dfshealth.jsp

3)在把我写好的程序,放在master,用命令行调用的时候,扔了一个错误。

java.lang.OutOfMemoryError: Java heap space,google了一下,大致就是配置问题。默认的,每一个node的,运行时的内存大小大概为200m。

解决方案,就是增大内存

我用的是2.1.0的。

修改的是

hadoop-env.sh

export HADOOP_HEAPSIZE=1000

export HADOOP_CLIENT_OPTS="-Xmx512m $HADOOP_CLIENT_OPTS"

然后网上查的资料。以前版本是

hadoop-site.xml

<property>

<name>mapred.child.java.opts</name>

<value>-Xmx1024m</value>

</property>

根据下面这篇文章的说法,要把配置复制到node上去。不能只是部署到master。为了省点事情,我就这么做了。

http://blog.csdn.net/mango_song/article/details/8314392

自学hadoop(三)的更多相关文章

  1. 从零自学Hadoop(22):HBase协处理器

    阅读目录 序 介绍 Observer操作 示例下载 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sour ...

  2. 从零自学Hadoop(20):HBase数据模型相关操作上

    阅读目录 序 介绍 命名空间 表 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...

  3. 从零自学Hadoop(21):HBase数据模型相关操作下

    阅读目录 序 变量 数据模型操作 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...

  4. 从零自学Hadoop(19):HBase介绍及安装

    阅读目录 序 介绍 安装 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 上一篇, ...

  5. 从零自学Hadoop(18):Hive的CLI和JDBC

    阅读目录 序 Hive CLI(old CLI) Beeline CLI(new CLI) JDBC Demo下载 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出 ...

  6. 从零自学Hadoop(02):环境准备

    阅读目录 起因 虚拟机 Linux 系统安装 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceL ...

  7. 从零自学Hadoop(03):Linux准备上

    阅读目录 序 检查列表 常用Linux命令 搭建环境 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sou ...

  8. 从零自学Hadoop(04):Linux准备下

    阅读目录 序 搭建环境 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 我们已经准 ...

  9. 从零自学Hadoop(05):Ambari

    阅读目录 序 引入背景 Ambari介绍 在线安装 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sour ...

  10. 从零自学Hadoop(06):集群搭建

    阅读目录 序 集群搭建 监控 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 上一 ...

随机推荐

  1. C#实现的ReplaceFirst和ReplaceLast

    原文:C#实现的ReplaceFirst和ReplaceLast ReplaceFirst: public static string ReplaceFirst(string input, strin ...

  2. 编写自己的TRACE函数

    TRACE函数是MFC里面的一个宏,是对OutputDebugString的封装. OutputDebugString的作用是输出调试信息,不要以为这个函数只有在Debug版本才会打日志,即使是Rel ...

  3. OpenCV源码阅读(2)---matx.h---函数的内联实现

    外部矩阵计算函数 namespace internal { template<typename _Tp, int m> struct Matx_DetOp { double operato ...

  4. RMI

    Java RMI (Remote Method Invocation 远程方法调用)是用Java在JDK1.1中实现的,它大大增强了Java开发分布式应用的能力.Java作为一种风靡一时的网络开发语言 ...

  5. C# 静态类 + c# 访问器 用途

    C# 静态类    http://blog.csdn.net/dodream/article/details/4588498 静态类的主要特性:仅包含静态成员. 无法实例化. 是密封的. 不能包含实例 ...

  6. .net 生成拼音码与五笔码

    首先加入配置文件: <?xml version="1.0" encoding="utf-8" ?> <CodeConfig> <S ...

  7. 配置centos 7 mysql

    http://www.cnblogs.com/starof/p/4680083.html 一.系统环境 yum update升级以后的系统版本为 [root@yl-web yl]# cat /etc/ ...

  8. C++ STL之set的基本操作

    set是集合,虽然也存在键值和实值,不过两者根本就是同一个值,键值的设置完全就是为了满足红黑树的底层结构,set操作与map很像不过也有些不同. 1. set迭代器与map的不同: (1)set使用接 ...

  9. UVa 11235 (RMQ) Frequent values

    范围最值问题,O(nlogn)的预处理,O(1)的查询. 这个题就是先对这些数列进行游程编码,重复的元素只记录下重复的次数. 对于所查询的[L, R]如果它完全覆盖了某些连续的重复片段,那么查询的就是 ...

  10. android-async-http

    安装 http://blog.csdn.net/wangwei_cq/article/details/9453345 包内的一些基本的参数 http://www.cnblogs.com/manuose ...