注:图片如果损坏,点击文章链接:https://www.toutiao.com/i6812623309138559500/

创建项目

准备pom.xml文件配置(附在文档最后)

在下载jar过程中极其缓慢,简直不能忍受,查阅了下资料,得到下面的办法:

1、 maven仓库中没有支持cdh的相关依赖。cloudera自己建立了一个相关的仓库。要想利用maven添加相关依赖,则必须单独添加cloudera仓库

2、 在国内使用maven中央仓库一般会有网络问题,大部分人会使用aliyun仓库或者其他开源的仓库。所以需要修改setting.xml (以下配置中 *,!cloudera 表示除了aliyun仓库还使用cloudera仓库)

配置:

<mirror>
         <id>nexus-aliyun</id>
         <mirrorOf>*,!cloudera</mirrorOf>
         <name>Nexus aliyun</name>                    
         <url>
           http://maven.aliyun.com/nexus/content/groups/public
         </url>
</mirror>

配置环境

下面两个配置表示是在本地运行还是到Linux环境中运行

dev

编写内容

local

编写内容

准备log4j的日志配置,这个网上很多,可以直接复制一份,改下关键地方就可以

HDFS连接地址的配置

Hbase的连接配置

配置文件transformer-env.xml

文件内容

pom.xml文件配置

<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>
  <groupId>com.xlgl.wzy</groupId>
  <artifactId>localenv</artifactId>
  <version>0.0.1-SNAPSHOT</version>
   <properties>
    <hadoop.version>2.7.3</hadoop.version>
    <hbase.version>1.2.5</hbase.version>
    <hive.version>2.1.1</hive.version>
    <mysql.version>5.1.6</mysql.version>
    <gson.version>2.6.2</gson.version>
    <uasparser.version>0.6.1</uasparser.version>
  </properties>
 
         <repositories>
                  <!-- 指定该项目可以从哪些地方下载依赖包 -->
                  <repository>
                          <id>aliyun</id>
                          <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
                  </repository>
                  <repository>
                          <id>cloudera</id>
                          <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
                  </repository>
                  <repository>
                          <id>jboss</id>
                          <url>http://repository.jboss.org/nexus/content/groups/public</url>
                  </repository>
         </repositories>
 
  <dependencies>
    <dependency>
      <groupId>org.apache.hadoop</groupId>
      <artifactId>hadoop-client</artifactId>
      <version>${hadoop.version}</version>
    </dependency>
 
    <dependency>
      <groupId>org.apache.hbase</groupId>
      <artifactId>hbase-client</artifactId>
      <version>${hbase.version}</version>
    </dependency>
 
    <dependency>
      <groupId>org.apache.hbase</groupId>
      <artifactId>hbase-server</artifactId>
      <version>${hbase.version}</version>
    </dependency>
 
    <dependency>
      <groupId>org.apache.hive</groupId>
      <artifactId>hive-exec</artifactId>
      <version>${hive.version}</version>
    </dependency>
 
    <!-- mysql start -->
    <dependency>
      <groupId>mysql</groupId>
      <artifactId>mysql-connector-java</artifactId>
      <version>${mysql.version}</version>
    </dependency>
    <!-- mysql end -->
 
    <dependency>
      <groupId>cz.mallat.uasparser</groupId>
      <artifactId>uasparser</artifactId>
      <version>${uasparser.version}</version>
    </dependency>
 
    <dependency>
      <groupId>com.google.code.gson</groupId>
      <artifactId>gson</artifactId>
      <version>${gson.version}</version>
    </dependency>
  </dependencies>
 
  <profiles>
    <!-- 指定环境 -->
    <profile>
      <!-- 指定本地运行环境,windows环境 -->
      <id>local</id>
      <activation>
        <activeByDefault>true</activeByDefault>
      </activation>
      <build>
        <resources>
                <resource>
                         <directory>configuration/local</directory>
                </resource>
                <resource>
                         <directory>src/main/resources</directory>
                </resource>
        </resources>
        <plugins>
          <plugin> 
            <!-- 支持多个不同文件夹中的java代码进行编译 -->
            <groupId>org.codehaus.mojo</groupId>
            <artifactId>build-helper-maven-plugin</artifactId>
            <version>1.4</version>
            <executions>
              <execution>
                <id>add-source</id> 
                <phase>generate-sources</phase> 
                <goals> 
                  <goal>add-source</goal> 
                </goals> 
                <configuration> 
                  <sources> 
                    <source>${basedir}/src/main/java</source>
                    <source>${basedir}/src/main/extr</source>
                  </sources>
                </configuration> 
              </execution> 
            </executions> 
          </plugin>
        </plugins>
      </build>
    </profile>
 
    <profile>
      <!-- hadoop环境运行, linux环境 -->
      <id>dev</id>
      <build>
        <resources>
                <resource>
                         <directory>configuration/dev</directory>
                </resource>
                <resource>
                         <directory>src/main/resources</directory>
                </resource>
        </resources>
        <plugins>
          <plugin> 
            <groupId>org.codehaus.mojo</groupId>
            <artifactId>build-helper-maven-plugin</artifactId>
            <version>1.4</version>
            <executions>
              <execution>
                <id>add-source</id> 
                <phase>generate-sources</phase> 
                <goals> 
                  <goal>add-source</goal> 
                </goals> 
                <configuration> 
                  <sources> 
                    <source>${basedir}/src/main/java</source>
                  </sources>
                </configuration> 
              </execution> 
            </executions> 
          </plugin>
 
          <plugin>
            <!-- 该插件的作用是将jar文件打包到最终形成的项目jar文件中 -->
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-shade-plugin</artifactId>
            <version>2.1</version>
            <executions>
              <execution>
                <phase>package</phase>
                <goals>
                  <goal>shade</goal>
                </goals>
                <configuration>
                  <artifactSet>
                    <includes>
                      <include>cz.mallat.uasparser:uasparser</include>
                      <include>net.sourceforge.jregex:jregex</include>
                      <include>mysql:mysql-connector-java</include>
                    </includes>
                  </artifactSet>
                </configuration>
              </execution>
            </executions>
          </plugin>        
        </plugins>
      </build>
    </profile>
  </profiles>
 
  <build>
    <testSourceDirectory>src/test/java</testSourceDirectory>
    <plugins>
    <plugin>   
            <artifactId>maven-assembly-plugin</artifactId>   
            <configuration>   
                <descriptorRefs>   
                    <descriptorRef>jar-with-dependencies</descriptorRef>   
                </descriptorRefs>   
            </configuration>   
            <executions>   
                <execution>   
                    <id>make-assembly</id>   
                    <phase>package</phase>   
                    <goals>   
                        <goal>assembly</goal>   
                    </goals>   
                </execution>   
            </executions>   
      </plugin>
      <plugin>
        <artifactId>maven-compiler-plugin</artifactId>
        <version>3.3</version>
        <configuration>
          <source>1.8</source>
          <target>1.8</target>
          <encoding>utf8</encoding> <!-- 默认是gbk -->
        </configuration>
      </plugin>
    </plugins>
    <pluginManagement>
             <plugins>
                     <!--This plugin's configuration is used to store Eclipse m2e settings only. It has no influence on the Maven build itself.-->
                     <plugin>
                              <groupId>org.eclipse.m2e</groupId>
                              <artifactId>lifecycle-mapping</artifactId>
                              <version>1.0.0</version>
                              <configuration>
                                       <lifecycleMappingMetadata>
                                                <pluginExecutions>
                                                         <pluginExecution>
                                                                 <pluginExecutionFilter>
                                                                          <groupId>org.codehaus.mojo</groupId>
                                                                          <artifactId>
                                                                                   build-helper-maven-plugin
                                                                          </artifactId>
                                                                          <versionRange>[1.4,)</versionRange>
                                                                          <goals>
                                                                                   <goal>add-source</goal>
                                                                          </goals>
                                                                 </pluginExecutionFilter>
                                                                 <action>
                                                                          <ignore></ignore>
                                                                 </action>
                                                        </pluginExecution>
                                                </pluginExecutions>
                                       </lifecycleMappingMetadata>
                              </configuration>
                     </plugin>
             </plugins>
    </pluginManagement>
  </build>

本地Java大数据环境基础配置(Maven)的更多相关文章

  1. Java 中 JDBC 基础配置

    Java 中 JDBC 基础配置 <resource auth="Container" driverclassname="oracle.jdbc.driver.Or ...

  2. Java 在windows中配置Maven环境和阿里云镜像

    目录 1. 下载Maven 2. 配置环境变量 3. 配置镜像 4. 配置本地仓库 1. 下载Maven 官网:https://maven.apache.org/ 下载:apache-maven-3. ...

  3. Java SpringMVC学习--基础配置

    快速开始一个基于SpringMVC框架的web项目 开发工具 Eclipse neon.2 运行环境 tomcat8.5 1.在Eclipse中新建一个web项目:File-New-Dynamic W ...

  4. java项目其他基础配置

    创建完maven项目之后. 1.pom.xml文件配置项目相关的架包. 2.src.main.resources下边 创建文件夹:spring以及mapper. 3.src.main.resource ...

  5. Maven下载 || 配置本地仓库 || IntelliJ IDEA配置Maven教程

    本文章主要介绍1.Maven下载   2.配置本地仓库Repository   3.IDEA配置Maven 三点. 相关博客: Eclipse配置Maven https://www.cnblogs.c ...

  6. 【Java架构:基础技术】一篇文章搞掂:Spring Tool Suite(STS)

    1.简介 STS,是一个自定义版本的Eclipse,她可以方便地用来与各种Spring项目进行交互协作,建议采用Spring进行开发的时候,可以尝试使用这个IDE 2.下载与安装 登录https:// ...

  7. Maven基础配置—本地Maven配置

    1.下载客户端 通过http://maven.apache.org/download.cgi#下载Maven本地客户端. 我下载的是apache-maven-3.2.5-bin.zip,在D盘解压. ...

  8. Eclipse+Maven整合开发Java项目(一)➣Maven基础环境配置

    概述 Maven是一个Java语言编写的开源项目管理工具,是Apache软件基金会的顶级项目.主要用于项目构建,依赖管理,项目信息管理.有些项目需要添加响应的依赖包,Maven就是公用包集合.存在远程 ...

  9. 安装eclipse(tomcat配置maven搭建){Java基础之开发工具}

    安装eclipse 1.下载eclipse-jee-neon-3-win32-x86_64 zip 百度云盘 解压 2. 下载JDK 官网 JDK 8 JDK电脑上环境变量配置 Path路径    % ...

随机推荐

  1. python解释器安装指导教程

    python解释器安装指导教程 1.官网下载 进入官网https://www.python.org/,在download下选择符合操作系统的版本 在找到合适的版本后选择相应的安装文件下载 2.进行安装 ...

  2. ciscn_2019_s_4***(栈迁移)

    这是十分经典的栈迁移题目 拿到题目例行检查 32位程序开启了nx保护 进入ida,发现了很明显的system 我们进入main函数查看vul 可以看到溢出的部分不够我们rop所以这道题通过栈迁移去做 ...

  3. 资源的批量删除与替换(Project)

    <Project2016 企业项目管理实践>张会斌 董方好 编著 资源分配好以后,嗯,很满意! 可是!有人看了不满意,或者自己手贱分配错了,要改? 改就改呗,和分配有什么区别吗? 没有啊! ...

  4. Google earth engine 绘制图像间散点图

    这段代码实现了在Google earth engine中绘制图像/波段间的散点图,得到相关关系.适用于探究数据间的相关性,进行数据的交叉验证. 代码来源于官方帮助:https://developers ...

  5. Django记录操作日志、LogEntry的使用

    LogEntry是在后台开发中经常用到的模块,它在admin是默认开启的. 可以使用LogEntry模块记录所有用户的操作记录.一方面可以用来监督,另一方面可以用来做回滚. 1. 使用LogEntry ...

  6. atexit模块介绍

    atexit 模块介绍 python atexit 模块定义了一个 register 函数,用于在 python 解释器中注册一个退出函数,这个函数在解释器正常终止时自动执行,一般用来做一些资源清理的 ...

  7. 事件处理 及冒泡 阻止默认事件 以及tab 切换的思路

    1.axios post通过点击事件提交数据不需要使用input直接使用state2.pdd你好天天象上默认执行点击(1,2,3)也可以执行并且能切换页码3.tab 针对新闻不同时4.天天象上首页和精 ...

  8. 经验:如何使用replace而不丢失数据

    背景:replace很好用,的应用场景比较多,但是直接使用可能会造成一引起字段的值丢失. 解决方法: 一.原始数据 select id,f1,f2 ,flag from update_test; id ...

  9. TensorFlow.NET机器学习入门【3】采用神经网络实现非线性回归

    上一篇文章我们介绍的线性模型的求解,但有很多模型是非线性的,比如: 这里表示有两个输入,一个输出. 现在我们已经不能采用y=ax+b的形式去定义一个函数了,我们只能知道输入变量的数量,但不知道某个变量 ...

  10. C++之去重

    note 今天刷题,忘了去重复库函数,于是手写了一个. 前提: 必须保证数组是有序的. 源码 template <typename T> void unique_arr(T arr[], ...