大数据的发展趋势日渐明显,但是进入这个领域的门槛不小,除了要有心理准备,其次就是要付诸实际行动中去学习。

  学习方法有很多,在没有基础的前提下,自学是因人而异是有难度。其次是大数据目前的工作方向主要是三个:大数据应用,数据分析,大数据研发,当然还有一些机器学生有关的数据挖掘什么的,也在这个类别,我暂时归到研发方向,因为要应用的话,还得结合一些行业和业务进行,所以你要从事大数据,可能要先定一下方向哈,就难易度来选,科多大数据建议可以在这个方向考虑一下。

  如果都是在小白的情况下,可以首先根据自己的性格特征去选择,如果自己个人比较喜欢技术也能耐得住性子,就可以选择大数据研发方向,如果个人比较喜欢综合性的发展方向又担心自己坐不住害怕太难,就可以选择数据分析方向。就这两个学习方向的语言基础要求是不一样的,一个是java,一个是python。根据方向,科多大数据整理来一些需要的技能,供你参考,如下:

  最基本的是JAVA核心API有关内容,当然有JAVA开发经验的最容易入门,比如从事过JAVAWEB开发的,基本上可以很容易跳进大数据应用方向,如果没有JAVA基础,很多内容你会理解不了。同时除了基本的基础以外,我在下面还给你罗列了一些列必须的技能:

  Java高级(VM相关、并发相关,线程相关)

  2、Linux 基本操作(环境,命令,网络等相关内容)

  3、Hadoop(此处为通常指的是HDFS+MapReduce+Yarn的相关内容 )

  4、HBase(JavaAPI操作+Phoenix )

  5、Hive(Hql基本操作和原理理解)

  6、Kafka

  7、Storm

  8、Scala

  9、Python

  10、Spark (Core+sparksql+Spark streaming )

  如果要把大数据玩得比较洋气,个人建议还要学习一些高级技术,不过不建议一开始就去触碰,毕竟这些技术个人建议还是有一些经验积累后再来哈,会比较快。学习建议如下:

  一定要把JAVA基础和JAVA高级部分学好,把JAVA做为第一开发语言,这个是关键,其次,Python也要引起重视,可以做为第二开发语言去学习掌握。

  一定要把Linux的基础操作,网络操作,文件操作等学好,掌握熟练,特别在环境配置部分,要多熟悉各种命令,同时也要多熟悉系统的基本结构。

  关于Hadoop、Hive等环境和技术应用,要结合一些实际点的案例来学要快一些,简单的Demo很难看到一些现象。

  以上是大数据研发方向,如果是数据分析方向的话,可以一开始就学习和了解一下python,从初级到高级,其次就是学会能用python写一些爬虫程序,能获取简单的一些数据。再学习Numpy及Pandas、spss,sass,及机器学习算法和业务数据分析,spark数据分析等等;

  个人建议可以买些书来看,当然看书效果因人而异也有可能效果不太好,可以去找一些网课,跟着视频学,也可以选择去报名参加下一些专业培训班,集中学习。

学大数据是先学java还是先学python?的更多相关文章

  1. 学大数据一定要会Java开发吗?

    Java是目前使用广泛的编程语言之一,具有的众多特性,特别适合作为大数据应用的开发语言.Java语言功能强大和简单易用,不仅吸收了C++语言的各种优点还摒弃了C++里难以理解的多继承.指针等概念. J ...

  2. 开发入门,学Java还是学大数据?

    经常有人问,我想学习开发,到底是学Java好还是学大数据好?或者是,学习大数据还有必要学Java吗?      依我说,这个提问的标准答案是:两者都学.      先来甩两张图.      一张是腾讯 ...

  3. JavaEE 学大数据是否掌握 JavaSE 和 Linux 就够了?

    引言 如果你是学习大数据的童靴,可能经常在网上看到一些公众号或博客告诉你,学习大数据基础部分只需要掌握 JavaSE 和 Linux 就够了,至于 JavaWeb 和 JavaEE 简单了解一下就可以 ...

  4. 一起来学大数据——走进Linux之门,学习大数据的重中之重

    昨天我们看了有关大数据Hadoop的一些知识点,但是要在学习大数据之前,我们还是要为大数据的环境做一些的部署. 那么,今天我们就来讲讲开启我们大数据之路的Linux,跟上我们的脚步yo~ Linux介 ...

  5. 大数据中HBase的Java接口封装

    该文前提为已经搭建好的HBase集群环境,参见 HBase集群搭建与配置 ,本文主要是用Java编写一个Servlet接口,部署在Tomcat服务器上,用于提供http的接口供其他地方调用,接口中集成 ...

  6. 大数据-09-Intellij idea 开发java程序操作HDFS

    主要摘自 http://dblab.xmu.edu.cn/blog/290-2/ 简介 本指南介绍Hadoop分布式文件系统HDFS,并详细指引读者对HDFS文件系统的操作实践.Hadoop分布式文件 ...

  7. 零基础大数据入门教程:Java调用阿里云短信通道服务

    这里我们使用SpringBoot 来调用阿里通信的服务. 阿里通信,双11.收到短信,日发送达6亿条.保障力度非常高. 使用的步骤: 1.1. 第一步:需要开通账户 1.2. 第二步:阅读接口文档 1 ...

  8. 一句话了解JAVA与大数据之间的关系

    大数据无疑是目前IT领域的最受关注的热词之一.几乎凡事都要挂上点大数据,否则就显得你OUT了.如果再找一个可以跟大数据并驾齐驱的IT热词,JAVA无疑是跟大数据并驾齐驱的一个词语.很多人在提到大数据的 ...

  9. Java转大数据开发全套视频资料

    大数据在近两年可算是特别火,有很多人都想去学大数据,有java转大数据的,零基础学习大数据的.但是大数据真的好学吗. 我们先来了解一下什么是大数据. 大数据是指无法在一定时间内用常规软件工具对其内容进 ...

随机推荐

  1. Docker学习笔记之从镜像仓库获得镜像

    0x00 概述 之前我们说到了,Docker 与其他虚拟化软件的一处不同就是将镜像管理纳入到了功能之中.实现虚拟化只是程序能够无缝移植的一部分,而有了镜像管理,就真正取代了我们在移植过程中的繁琐操作. ...

  2. Golang匿名函数

    概念所谓匿名函数,就是没有名字的函数匿名函数的两种使用方式一.在定义匿名函数的时候就可以直接使用(这种方式只使用一次) package main import ( "fmt" ) ...

  3. python之块包导入

    一.模块 1.什么是模块 常见的场景:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀. 但其实import加载的模块分为四个通用类别: 1 使用python编写 ...

  4. OSI7层模型(TCP4层)

    OSI7层模型(TCP4层) 第一层:物理层 在局部局域网络上传送帧,它负责管理电脑通信设备和网络媒体之间的互通.包括了针脚.电压.线缆规范.集线器.中继器.网卡.主机适配器等. 第二层:数据链路层 ...

  5. repo forall -c 用法【转】

    本文转载自:https://blog.csdn.net/u010164190/article/details/78332484 .repo forall命令 # repo forall -help # ...

  6. sqlitestudio

    SQLite数据库的特性 特点: 1.轻量级2.独立性,没有依赖,无需安装3.隔离性 全部在一个文件夹系统4.跨平台 支持众多操作系统5.多语言接口 支持众多编程语言6.安全性 事物,通过独占性和共享 ...

  7. 【特性】Redis4.0新特性

    模块系统 Redis 4.0 发生的最大变化就是加入了模块系统, 这个系统可以让用户通过自己编写的代码来扩展和实现 Redis 本身并不具备的功能, 具体使用方法可以参考 antirez 的博文< ...

  8. Centos 7 官网下载安装mysql server 5.6

    Centos 7 官网下载安装 mysql server # wget http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rp ...

  9. LOJ6282 数列分块入门6(分块+暴力)

    真是暴力 #include <cstdio> #include <algorithm> #include <cstring> #include <vector ...

  10. Transaction之EF

    了解Entity Framework中事务处理 Entity Framework 6以前,框架本身并没有提供显式的事务处理方案,在EF6中提供了事务处理的API. 所有版本的EF,只要你调用SaveC ...