Local模式下Spark程序只输出关键信息
使用spark-submit提交local任务时,会输出很多Info信息:
-------------------------------------------
Time: ms
------------------------------------------- // :: INFO scheduler.JobScheduler: Finished job streaming job ms. from job set of time ms
// :: INFO scheduler.JobScheduler: Total delay: 0.054 s for time ms (execution: 0.046 s)
// :: INFO rdd.MapPartitionsRDD: Removing RDD from persistence list
// :: INFO storage.BlockManager: Removing RDD
// :: INFO rdd.MapPartitionsRDD: Removing RDD from persistence list
// :: INFO storage.BlockManager: Removing RDD
// :: INFO rdd.BlockRDD: Removing RDD from persistence list
// :: INFO dstream.SocketInputDStream: Removing blocks of RDD BlockRDD[] at socketTextStream at CoGroupTest.scala: of time ms
// :: INFO storage.BlockManager: Removing RDD
// :: INFO rdd.MapPartitionsRDD: Removing RDD from persistence list
// :: INFO storage.BlockManager: Removing RDD
// :: INFO rdd.MapPartitionsRDD: Removing RDD from persistence list
// :: INFO storage.BlockManager: Removing RDD
// :: INFO scheduler.ReceivedBlockTracker: Deleting batches: ms
// :: INFO scheduler.InputInfoTracker: remove old batch metadata: ms
// :: INFO scheduler.JobScheduler: Added jobs for time ms
// :: INFO scheduler.JobScheduler: Starting job streaming job ms. from job set of time ms
可以修改log4j的日志级别,只输出关键信息:
1.修改$SPARK_HOME/conf/log4j.properties
如果有log4j.properties.template,则复制一份为log4j.properties
cp log4j.properties.template log4j.properties
2.修改第一行
log4j.rootCategory=INFO, console
为
log4j.rootCategory=ERROR, console
3.再次提交任务,只会输出关键信息:
-------------------------------------------
Time: ms
-------------------------------------------
(helloworld,helloworld_one)
(hello,hello_one)
(join,join_one)
Local模式下Spark程序只输出关键信息的更多相关文章
- IntelliJ IDEA在Local模式下Spark程序消除日志中INFO输出
在使用Intellij IDEA,local模式下运行Spark程序时,会在Run窗口打印出很多INFO信息,辅助信息太多可能会将有用的信息掩盖掉.如下所示 要解决这个问题,主要是要正确设置好log4 ...
- spark学习14(spark local模式运行spark程序的报错)
报错1 java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. 解 ...
- 【gp数据库】查询系统表看模式下所有表的分布键信息
Greenplum是关系型的分布式数据库,需要存储的数据库在进入数据库时,将先进行数据分布的处理工作,讲一个表的数据平均分不到每个节点上,并为每个表指定一个分发列(distribute Column) ...
- 在local模式下的spark程序打包到集群上运行
一.前期准备 前期的环境准备,在Linux系统下要有Hadoop系统,spark伪分布式或者分布式,具体的教程可以查阅我的这两篇博客: Hadoop2.0伪分布式平台环境搭建 Spark2.4.0伪分 ...
- [Spark]如何设置使得spark程序不输出 INFO级别的内容
Spark程序在运行的时候,总是输出很多INFO级别内容 查看了网上的一些文章,进行了试验. 发现在 /etc/spark/conf 目录下,有一个 log4j.properties.template ...
- 命令行以及Python交互模式下python程序的编写
一.命令行模式 在Windows开始菜单选择“命令提示符”,就进入到命令行模式,它的提示符类似C:\>: 二.Python交互模式 在命令行模式下敲命令python,就看到类似如下的一堆文本输出 ...
- 【 PostgreSQL】查询某模式下所有表的分布键信息
想看下某模式下所有表创建的分布键是否合理,查找系统表文档拼出如下sql,亲们如果有更好的sql或者意见欢迎留言! SELECT aaa.nspname AS "模式名", ...
- Ansible 如何只输出错误信息?
有时主机较多时,我们只想关注有问题的主机. Ansible callback 插件中有一个 actionable,官方描述为: actionable - shows only items that n ...
- make only output error/warning message( 编译时,只输出错误信息和警告信息)
make > /dev/null 这样,正常的信息被重定向输出到/dev/null,错误和警告信息会输出到标准错误设备(standard error,相对于标准输入/输出设备来说).
随机推荐
- 利刃 MVVMLight 5:绑定在表单验证上的应用
表单验证是MVVM体系中的重要一块.而绑定除了推动 Model-View-ViewModel (MVVM) 模式松散耦合 逻辑.数据 和 UI定义 的关系之外,还为业务数据验证方案提供强大而灵活的支持 ...
- USACO Section 1.1-1 Your Ride Is Here
USACO 1.1-1 Your Ride Is Here 你的飞碟在这儿 众所周知,在每一个彗星后都有一只UFO.这些UFO时常来收集地球上的忠诚支持者.不幸的是,他们的飞碟每次出行都只能带上一组支 ...
- JSON对象、JSON字符串的相互转换
JSON对象.JSON字符串的相互转换 json的格式: 第一种方式: 单一的json字符串,转换成json对象时,需要 eval('(' + json + ')');这样的格式,中间需要加括号 va ...
- error C2664: “UINT GetDriveTypeW(LPCWSTR)”: 无法将参数 1 从“char [5]”转换为“LPCWSTR”
解决方法:右击项目选择属性--->配置属性--->常规,将字符集改为“使用多字节字符符集”,应用确定即可. 来自为知笔记(Wiz)
- SysTick定时器
SysTick是一个24位的倒计数定时器,当计到0时,将从RELOAD寄存器中自动重装载定时初值.只要不把它在SysTick控制及状态寄存器中的使能位清除,就永不停息.下边小结了SysTick的相关寄 ...
- Ubuntu中文本地化后字体改变
ubuntu中文本地化后会安装2个字体 fonts-arphic-ukai fonts-arphic-uming 找到这两个字体删除之.. sudo apt- get remove fonts-arp ...
- Unity使用GL画线
脚本需挂在相机上,如果你的脚本,编辑器报错了,Matrix stack full depth reached,加上这个方法试试GL.LoadPixelMatrix(); using System.Co ...
- Google Earth影像数据破解之旅
"Zed, you are so excellent." 为什么要写这句英文?容我卖个关子稍后再解释. 相信大多数人都体验过Google Earth(简称GE),我对GE最初的印象 ...
- C#网络程序设计(3)网络传输编程之TCP编程
网络传输编程指基于各种网络协议进行编程,包括TCP编程,UDP编程,P2P编程.本节介绍TCP编程. (1)TCP简介: TCP是TCP/IP体系中最重要的传输层协议,它提供全双工和可 ...
- Git操作指南
请访问以下网址,很详细,今天偷个懒记录一下,之后有时间再来补全吧! https://git-scm.com/book/zh/v2