Vvio总共就一轮技术面+一轮HR面,技术面总体而言,比较宽泛,比较看中基础,面试的全程没有涉及简历上的东西(都准备好跟他扯项目了,感觉是抽取的题库。。。)具体内容如下:

1.熟悉Hadoop哪些组件?

答:hdfs、yarn、MapRedue、Hive

2.讲一讲yarn的调度过程?

答:blabla。。。

3.yarn的调度器有哪些?

答:FIFO、多队列分开调度、CapacityScheduler、FairScheduler。。。(当时没答全)

4.讲讲Hive内部表和外部表的区别?

答:(1)内部表完全受Hive管理,外部表除了受Hive管理外,还受HDFS的管理

  (2)删除内部表数据的话,元数据和存储数据都会被删除,而删除外部表的话,只有元数据会被删除,而存储在hdfs中的数据不会被删除。

  (3)外部表通过external关键字来创建,内部表不需要。

  (4)对内部表的结构进行修改后,会同步给元数据;而对外部表的结构进行修改后,需要进行修复。

5.Hive的join操作怎么写?

答:blabla....

6.Mapper和Reducer写过吗?

答:好久没写了,忘记了。。。

问:udf呢?

答:。。。。

7.熟悉哪些排序?

答:堆排序、快排、归并排序、直接插入排序、简单选择排序

问:那手写下快排

答:。。。(幸好前一天晚上又了遍)

8.MapReduce的哪个过程用到了排序?

答:shuffle过程用到了归并排序(这里说错了个地方,把shuffle过程说成了是在Reduce阶段的刚开始,实际上是在Map阶段的结尾处)。。。

9.Linux熟悉吗?

答:基本的常用命令比较熟悉...

问:如何找出最近三天修改过的文件?

答:find命令,具体参数忘记了,囧。。。

问:如何显示各个程序占用的端口?

答:我。。。netstat?(这一块还是要加强。。。)

10.计算机网络熟悉吗?TCP的三次握手和四次挥手讲一下?

答:blabla。。。。

问:为什么要三次握手而不用两次握手,举个实际的例子说明下》

答:(这不分答得不好,主要是好久没看计算机网络了。。)

11.给你一个1G的文件,机器的内存只有1M,如何利用机器找出出现次数最多的100个字符串?

答:将大文件分成小文件,每个小文件进行统计,找出最大的100个字符串出来,然后将每个小文件统计的前100个出现次数最多的字符串存放到一个文件中,在该文件中找出出现次数最多的100个字符串出来即最终的出现次数最多的100个字符串。

问:具体是如何划分的呢?

答:感觉这里答的不是很好,我是按照单词的个数进行划分的,如果单词的数量凑够1M的话,就分割成一个小文件(感觉面试官不是很满意,这种题型之前看的少,没有很深入的思考过,结果弊端就显现出来了。。。)

=========================================================分割线===================================================================

基本上就这些问题了,总体而言问的实际上并不是很难,一方面由于第一次面试大数据开发相关岗位,没搞清楚知识点的懂点(其实这些问题都见过,只不过有些就一带而过了,没有深入的去学习思考;花费大量的时间在算法题上了,结果并没有怎么问算法题);另一方面秋招到春招好几个月了,已经没啥面试状态了。。。

2019春招——Vivo大数据开发工程师面经的更多相关文章

  1. 杭州某知名xxxx公司急招大量java以及大数据开发工程师

    因公司战略以及业务拓展,收大量java攻城狮以及大数据开发攻城狮. 职位信息: java攻城狮: https://job.cnblogs.com/offer/56032 大数据开发攻城狮: https ...

  2. 2019年2月备战春招最新大数据+Java岗位+人工智能岗位资料免费送【限时领取】

    不多说,直接上干货! 欢迎大家,关注微信扫码并加入我的3个微信公众号:   大数据躺过的坑      Java从入门到架构师      人工智能躺过的坑        每天都有大量的学习视频资料和精彩 ...

  3. 拼多多大数据开发工程师SQL实战解析

    不久前,裸考国内知名电商平台拼多多的大数据岗位在线笔试,问答题(写SQL)被虐的很惨,完了下来默默学习一波.顺便借此机会复习一下SQL语句的用法. 本文主要涉及到的SQL知识点包括CREATE创建数据 ...

  4. 大数据开发工程师面试《一》Shopee虾皮技术面

    一.项目问题 1 做了哪些项目2 使用什么技术3 哪个是你主导的项目,一共开发多少个接口,项目多长时间,数据库有多少个表 二.技术问题 1 用自己擅长的语言实现非递归单链表反转 现场手写2 Hadoo ...

  5. Java后端开发工程师是否该转大数据开发?

    撰写我对java后端开发工程师选择方向的想法,写给在java后端选择转方向的人 背景 看到一些java开发工程师,对java后端薪酬太悲观了.认为换去大数据领域就会高工资.觉得java后端没有前途.我 ...

  6. 2018年,Java程序员转型大数据开发,是不是一个好选择?

    近日网上有一篇关于Java程序员职场生存现状的文章“2017年 Java 程序员,风光背后的危机”,在Java程序员圈子里引起了广泛关注和热议. 2017年,Java 程序员面临更加激烈的竞争. 不得 ...

  7. 详解Kafka: 大数据开发最火的核心技术

    详解Kafka: 大数据开发最火的核心技术   架构师技术联盟 2019-06-10 09:23:51 本文共3268个字,预计阅读需要9分钟. 广告 大数据时代来临,如果你还不知道Kafka那你就真 ...

  8. BAT推荐免费下载JAVA转型大数据开发全链路教程(视频+源码)价值19880元

    如今随着环境的改变,物联网.AI.大数据.人工智能等,是未来的大趋势,而大数据是这些基石,万物互联,机器学习都是大数据应用场景! 为什么要学习大数据?我们JAVA到底要不要转型大数据? 好比问一个程序 ...

  9. 【内推】平安产险大数据测试开发工程师,15-30k!

    平安产险技术岗内部推荐-大数据测试开发工程师等-欢迎中年人和2020应届生 上班地点:深圳福田平安金融中心 另有大量 上海 北京 成都 广州 岗位 交流qq群 828186629 微信pythonte ...

随机推荐

  1. 修改权限linux

    1.更改目录所有者命令:chown -R 用户名称 目录名称2.更改目录权限命令:chmod -R 755 目录名称 nginx在不同目录下需要给与全部权限才可以

  2. QTCPSOCKET 客户端已连接 而服务器无响应

    最近在使用qt coding一个项目时,使用到了qtcpsocket模块来编写客户端与服务器.在windows平台下还能正常工作,但是在ubuntu平台下,客户端提示已连接时,服务器却没有响应.经过排 ...

  3. QA Report

  4. Linux中使用sed命令替换字符串小结

    sed替换的基本语法为: sed 's/原字符串/替换字符串/' 单引号里面,s表示替换,三根斜线中间是替换的样式,特殊字符需要使用反斜线”\”进行转义,但是单引号”‘”是没有办法用反斜线”\”转义的 ...

  5. [转]如何正确学习JavaScript

    原文:How to Learn JavaScript Properly(2014-2-7) 学习时长:6-8周 学习前提:中学水平,无需编程经验 更新(2014-1-7) 在Reddit上创建了一个学 ...

  6. vue 动态循环出的多个select 不能重复选择相同的数据

    看图说话 HTML: JS:        1)  2) 3) 有更好的方法可以相互学习.

  7. PowerShell在激活virtualenv虚拟环境时禁止运行的脚本的解决办法

    问题描述 在使用Django开发网站项目时,为了便于修改.维护以及项目部署,使用了virtualenv虚拟环境.这个工具允许你维护多个分离的Python环境,每个都具有它自己的库和包的命名空间.这种情 ...

  8. Scala基础

    1.seq[String] 用[]表示参数类型,java使用<>表示参数,因为Scala 允许以<命名方法和变量名,java不允许 2.支持range的类型:Char .Int . ...

  9. React 组件间通信介绍

    React 组件间通信方式简介 React 组件间通信主要分为以下四种情况: 父组件向子组件通信 子组件向父组件通信 跨级组件之间通信 非嵌套组件间通信 下面对这四种情况分别进行介绍:   父组件向子 ...

  10. transmission跳过文件校验功能实现

    贴吧链接:https://tieba.baidu.com/p/4839039900 GitHub:https://github.com/superlukia/transmission-2.92_ski ...