Spark metrics on wordcount example

I read the section Metrics on spark website. I wish to try it on the wordcount example, I can't make it work.

spark/conf/metrics.properties :

# Enable CsvSink for all instances

*.sink.csv.class=org.apache.spark.metrics.sink.CsvSink

# Polling period for CsvSink

*.sink.csv.period=1

*.sink.csv.unit=seconds

# Polling directory for CsvSink

*.sink.csv.directory=/home/spark/Documents/test/

# Worker instance overlap polling period

worker.sink.csv.period=1

worker.sink.csv.unit=seconds

# Enable jvm source for instance master, worker, driver and executor

master.source.jvm.class=org.apache.spark.metrics.source.JvmSource

worker.source.jvm.class=org.apache.spark.metrics.source.JvmSource

driver.source.jvm.class=org.apache.spark.metrics.source.JvmSource

executor.source.jvm.class=org.apache.spark.metrics.source.JvmSource

　　I run my app in local like in the documentation :

$SPARK_HOME/bin/spark-submit   --class "SimpleApp"   --master local[4]   target/scala-2.10/simple-project_2.10-1.0.jar

I checked /home/spark/Documents/test/ and it is empty.

What did I miss?

Shell:

$SPARK_HOME/bin/spark-submit   --class "SimpleApp"   --master local[4]  --conf   spark.metrics.conf=/home/spark/development/spark/conf/metrics.properties  target/scala-2.10/simple-project_2.10-1.0.jar

Spark assembly has been built with Hive, including Datanucleus jars on classpath

Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties

INFO SparkContext: Running Spark version 1.3.0

WARN Utils: Your hostname, cv-local resolves to a loopback address: 127.0.1.1; using 192.168.1.64 instead (on interface eth0)

WARN Utils: Set SPARK_LOCAL_IP if you need to bind to another address

INFO SecurityManager: Changing view acls to: spark

INFO SecurityManager: Changing modify acls to: spark

INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(spark); users with modify permissions: Set(spark)

INFO Slf4jLogger: Slf4jLogger started

INFO Remoting: Starting remoting

INFO Remoting: Remoting started; listening on addresses :[akka.tcp://sparkDriver@cv-local.local:35895]

INFO Utils: Successfully started service 'sparkDriver' on port 35895.

INFO SparkEnv: Registering MapOutputTracker

INFO SparkEnv: Registering BlockManagerMaster

INFO DiskBlockManager: Created local directory at /tmp/spark-447d56c9-cfe5-4f9d-9e0a-6bb476ddede6/blockmgr-4eaa04f4-b4b2-4b05-ba0e-fd1aeb92b289

INFO MemoryStore: MemoryStore started with capacity 265.4 MB

INFO HttpFileServer: HTTP File server directory is /tmp/spark-fae11cd2-937e-4be3-a273-be8b4c4847df/httpd-ca163445-6fff-45e4-9c69-35edcea83b68

INFO HttpServer: Starting HTTP Server

INFO Utils: Successfully started service 'HTTP file server' on port 52828.

INFO SparkEnv: Registering OutputCommitCoordinator

INFO Utils: Successfully started service 'SparkUI' on port 4040.

INFO SparkUI: Started SparkUI at http://cv-local.local:4040

INFO SparkContext: Added JAR file:/home/spark/workspace/IdeaProjects/wordcount/target/scala-2.10/simple-project_2.10-1.0.jar at http://192.168.1.64:52828/jars/simple-project_2.10-1.0.jar with timestamp 1444049152348

INFO Executor: Starting executor ID <driver> on host localhost

INFO AkkaUtils: Connecting to HeartbeatReceiver: akka.tcp://sparkDriver@cv-local.local:35895/user/HeartbeatReceiver

INFO NettyBlockTransferService: Server created on 60320

INFO BlockManagerMaster: Trying to register BlockManager

INFO BlockManagerMasterActor: Registering block manager localhost:60320 with 265.4 MB RAM, BlockManagerId(<driver>, localhost, 60320)

INFO BlockManagerMaster: Registered BlockManager

INFO MemoryStore: ensureFreeSpace(34046) called with curMem=0, maxMem=278302556

INFO MemoryStore: Block broadcast_0 stored as values in memory (estimated size 33.2 KB, free 265.4 MB)

INFO MemoryStore: ensureFreeSpace(5221) called with curMem=34046, maxMem=278302556

INFO MemoryStore: Block broadcast_0_piece0 stored as bytes in memory (estimated size 5.1 KB, free 265.4 MB)

INFO BlockManagerInfo: Added broadcast_0_piece0 in memory on localhost:60320 (size: 5.1 KB, free: 265.4 MB)

INFO BlockManagerMaster: Updated info of block broadcast_0_piece0

INFO SparkContext: Created broadcast 0 from textFile at SimpleApp.scala:11

WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

WARN LoadSnappy: Snappy native library not loaded

INFO FileInputFormat: Total input paths to process : 1

INFO SparkContext: Starting job: count at SimpleApp.scala:12

INFO DAGScheduler: Got job 0 (count at SimpleApp.scala:12) with 2 output partitions (allowLocal=false)

INFO DAGScheduler: Final stage: Stage 0(count at SimpleApp.scala:12)

INFO DAGScheduler: Parents of final stage: List()

INFO DAGScheduler: Missing parents: List()

INFO DAGScheduler: Submitting Stage 0 (MapPartitionsRDD[2] at filter at SimpleApp.scala:12), which has no missing parents

INFO MemoryStore: ensureFreeSpace(2848) called with curMem=39267, maxMem=278302556

INFO MemoryStore: Block broadcast_1 stored as values in memory (estimated size 2.8 KB, free 265.4 MB)

INFO MemoryStore: ensureFreeSpace(2056) called with curMem=42115, maxMem=278302556

INFO MemoryStore: Block broadcast_1_piece0 stored as bytes in memory (estimated size 2.0 KB, free 265.4 MB)

INFO BlockManagerInfo: Added broadcast_1_piece0 in memory on localhost:60320 (size: 2.0 KB, free: 265.4 MB)

INFO BlockManagerMaster: Updated info of block broadcast_1_piece0

INFO SparkContext: Created broadcast 1 from broadcast at DAGScheduler.scala:839

INFO DAGScheduler: Submitting 2 missing tasks from Stage 0 (MapPartitionsRDD[2] at filter at SimpleApp.scala:12)

INFO TaskSchedulerImpl: Adding task set 0.0 with 2 tasks

INFO TaskSetManager: Starting task 0.0 in stage 0.0 (TID 0, localhost, PROCESS_LOCAL, 1391 bytes)

INFO TaskSetManager: Starting task 1.0 in stage 0.0 (TID 1, localhost, PROCESS_LOCAL, 1391 bytes)

INFO Executor: Running task 0.0 in stage 0.0 (TID 0)

INFO Executor: Running task 1.0 in stage 0.0 (TID 1)

INFO Executor: Fetching http://192.168.1.64:52828/jars/simple-project_2.10-1.0.jar with timestamp 1444049152348

INFO Utils: Fetching http://192.168.1.64:52828/jars/simple-project_2.10-1.0.jar to /tmp/spark-cab5a940-e2a4-4caf-8549-71e1518271f1/userFiles-c73172c2-7af6-4861-a945-b183edbbafa1/fetchFileTemp4229868141058449157.tmp

INFO Executor: Adding file:/tmp/spark-cab5a940-e2a4-4caf-8549-71e1518271f1/userFiles-c73172c2-7af6-4861-a945-b183edbbafa1/simple-project_2.10-1.0.jar to class loader

INFO CacheManager: Partition rdd_1_1 not found, computing it

INFO CacheManager: Partition rdd_1_0 not found, computing it

INFO HadoopRDD: Input split: file:/home/spark/development/spark/conf/metrics.properties:2659+2659

INFO HadoopRDD: Input split: file:/home/spark/development/spark/conf/metrics.properties:0+2659

INFO MemoryStore: ensureFreeSpace(7840) called with curMem=44171, maxMem=278302556

INFO MemoryStore: Block rdd_1_0 stored as values in memory (estimated size 7.7 KB, free 265.4 MB)

INFO BlockManagerInfo: Added rdd_1_0 in memory on localhost:60320 (size: 7.7 KB, free: 265.4 MB)

INFO BlockManagerMaster: Updated info of block rdd_1_0

INFO MemoryStore: ensureFreeSpace(8648) called with curMem=52011, maxMem=278302556

INFO MemoryStore: Block rdd_1_1 stored as values in memory (estimated size 8.4 KB, free 265.4 MB)

INFO BlockManagerInfo: Added rdd_1_1 in memory on localhost:60320 (size: 8.4 KB, free: 265.4 MB)

INFO BlockManagerMaster: Updated info of block rdd_1_1

INFO Executor: Finished task 1.0 in stage 0.0 (TID 1). 2399 bytes result sent to driver

INFO Executor: Finished task 0.0 in stage 0.0 (TID 0). 2399 bytes result sent to driver

INFO TaskSetManager: Finished task 0.0 in stage 0.0 (TID 0) in 139 ms on localhost (1/2)

INFO TaskSetManager: Finished task 1.0 in stage 0.0 (TID 1) in 133 ms on localhost (2/2)

INFO DAGScheduler: Stage 0 (count at SimpleApp.scala:12) finished in 0.151 s

INFO TaskSchedulerImpl: Removed TaskSet 0.0, whose tasks have all completed, from pool

INFO DAGScheduler: Job 0 finished: count at SimpleApp.scala:12, took 0.225939 s

INFO SparkContext: Starting job: count at SimpleApp.scala:13

INFO DAGScheduler: Got job 1 (count at SimpleApp.scala:13) with 2 output partitions (allowLocal=false)

INFO DAGScheduler: Final stage: Stage 1(count at SimpleApp.scala:13)

INFO DAGScheduler: Parents of final stage: List()

INFO DAGScheduler: Missing parents: List()

INFO DAGScheduler: Submitting Stage 1 (MapPartitionsRDD[3] at filter at SimpleApp.scala:13), which has no missing parents

INFO MemoryStore: ensureFreeSpace(2848) called with curMem=60659, maxMem=278302556

INFO MemoryStore: Block broadcast_2 stored as values in memory (estimated size 2.8 KB, free 265.3 MB)

INFO MemoryStore: ensureFreeSpace(2056) called with curMem=63507, maxMem=278302556

INFO MemoryStore: Block broadcast_2_piece0 stored as bytes in memory (estimated size 2.0 KB, free 265.3 MB)

INFO BlockManagerInfo: Added broadcast_2_piece0 in memory on localhost:60320 (size: 2.0 KB, free: 265.4 MB)

INFO BlockManagerMaster: Updated info of block broadcast_2_piece0

INFO SparkContext: Created broadcast 2 from broadcast at DAGScheduler.scala:839

INFO DAGScheduler: Submitting 2 missing tasks from Stage 1 (MapPartitionsRDD[3] at filter at SimpleApp.scala:13)

INFO TaskSchedulerImpl: Adding task set 1.0 with 2 tasks

INFO TaskSetManager: Starting task 0.0 in stage 1.0 (TID 2, localhost, PROCESS_LOCAL, 1391 bytes)

INFO TaskSetManager: Starting task 1.0 in stage 1.0 (TID 3, localhost, PROCESS_LOCAL, 1391 bytes)

INFO Executor: Running task 0.0 in stage 1.0 (TID 2)

INFO Executor: Running task 1.0 in stage 1.0 (TID 3)

INFO BlockManager: Found block rdd_1_0 locally

INFO Executor: Finished task 0.0 in stage 1.0 (TID 2). 1830 bytes result sent to driver

INFO TaskSetManager: Finished task 0.0 in stage 1.0 (TID 2) in 9 ms on localhost (1/2)

INFO BlockManager: Found block rdd_1_1 locally

INFO Executor: Finished task 1.0 in stage 1.0 (TID 3). 1830 bytes result sent to driver

INFO TaskSetManager: Finished task 1.0 in stage 1.0 (TID 3) in 10 ms on localhost (2/2)

INFO DAGScheduler: Stage 1 (count at SimpleApp.scala:13) finished in 0.011 s

INFO TaskSchedulerImpl: Removed TaskSet 1.0, whose tasks have all completed, from pool

INFO DAGScheduler: Job 1 finished: count at SimpleApp.scala:13, took 0.024084 s

Lines with a: 5, Lines with b: 12

Spark metrics on wordcount example的更多相关文章

Spark初步从wordcount开始
Spark初步-从wordcount开始 spark中自带的example,有一个wordcount例子,我们逐步分析wordcount代码,开始我们的spark之旅. 准备工作把README.md ...
Spark练习之wordcount，基于排序机制的wordcount
Spark练习之wordcount 一.原理及其剖析二.pom.xml 三.使用Java进行spark的wordcount练习四.使用scala进行spark的wordcount练习五.基于排序 ...
Spark Streaming的wordcount案例
之前测试的一些spark案例都是采用离线处理,spark streaming的流处理一样可以运行经典的wordcount. 基本环境: spark-2.0.0 scala-2.11.0 IDEA-15 ...
Spark学习之wordcount程序
实例代码: import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.ap ...
006 Spark中的wordcount以及TopK的程序编写
1.启动启动HDFS 启动spark的local模式./spark-shell 2.知识点 textFile: def textFile( path: String, minPartitions: ...
在Spark上运行WordCount程序
1.编写程序代码如下: Wordcount.scala package Wordcount import org.apache.spark.SparkConf import org.apache.sp ...
提交任务到spark（以wordcount为例）
1.首先需要搭建好hadoop+spark环境,并保证服务正常.本文以wordcount为例. 2.创建源文件,即输入源.hello.txt文件,内容如下: tom jerry henry jim s ...
50、Spark Streaming实时wordcount程序开发
一.java版本 package cn.spark.study.streaming; import java.util.Arrays; import org.apache.spark.SparkCon ...
Spark中的Wordcount
目录通过scala语言基于local编写spark的Wordcount 基于yarn去调度WordCount 通过scala语言基于local编写spark的Wordcount import org ...

随机推荐

【转】不得不看的两次从C++回归C的高手评论C++
不得不看的两次从C++回归C的高手评论C++ Linux之父炮轰C++:糟糕程序员的垃圾语言 Linux之父话糙理不糙不得不看的两次从C++回归C的高手评论C++ C语言是否该扔进垃圾桶为什么每个 ...
linux的设置ip连接crt，修改主机名，映射，建文件
1.修改IP(或者vim vi /etc/sysconfig/network-scripts/ifcfg-eth0) 2.连接 crt 3.修改主机名用vim 编辑 /etc/sysconfig/n ...
git基础知识总结
1,clone git clone https://github.com/KoMiles/helloword helloword 2,pull git pull 3,commit git commit ...
vsftpd 搭建与介绍
CentOS Linux Vsftp服务器配置 CentOS Linux Vsftp服务器配置 1.开启防火墙ftp端口 vi /etc/sysconfig/iptables ...
JS判断一个数组中是否有重复值的三种方法
方法一: var s = ary.join(",")+","; for(var i=0;i<ary.length;i++) { if(s.replace( ...
javascript常量
javascript中没有常量的概念,虽然许多现代的变成环境可能为您提供了用以创建常量的const语句.对于的自己的变量,可以采用相同的命名约定,并且将他们以静态属性的方式添加到构造函数中. //构造 ...
E. Tetrahedron(数学推导)
E. Tetrahedron 分类: AC路漫漫2013-08-08 16:07 465人阅读评论(0) 收藏举报 time limit per test 2 seconds memory lim ...
RHEL 6.0使用CentOS yum源
引言:由于RHEL的yum在线更新是收费的,如果没有注册的话是不能使用的,即不能在线安装软件.在这种情况下,想使用RHEL系统,还想用yum源来在线安装软件,有没有办法?答案是有办法,请往下看! 1. ...
更改win7开机界面
按“win+R”组合键,打开运行框,在打开框中输入"regedit”,单击“确定”. 打开注册表编辑器,依次展开注册表里: “HKEY_LOCAL_MACHINE---SOFTWARE--- ...
Leetcode 之Construct Binary Tree（52）
根据先序和中序构造二叉树.根据中序和后序构造二叉树,基础题,采用递归的方式解决,两题的方法类似.需要注意的是迭代器的用法. //先序和中序 TreeNode *buildTree(vector< ...

Spark metrics on wordcount example

Spark metrics on wordcount example的更多相关文章

随机推荐

热门专题