告警和日志信息监控

hadoop集群启动

su - hadoop   #切换到hadoop用户
[hadoop@master ~]$ start-all.sh #启动

zookeeper集群启动

zkServer.sh start   #三个节点都要做
zkServer.sh status #查看集群状态

Hbase启动

[hadoop@master ~]$ start-hbase.sh

1.查看大数据平台主机日志

[hadoop@master ~]$ cd /var/log
[hadoop@master log]$ ll

2.查看内核及公共消息日志(/var/log/messages)。

内核及公共信息日志是许多进程日志文件的汇总,可以切换到 root 用户,采用 cat 或
tail 命令查看该文件。
[hadoop@master log]$ su root
password:
[root@master log]# tail messages

3.查看计划任务日志/var/log/cron。

[root@master log]# cat cron

4.查看系统引导日志/var/log/dmesg

[root@master log]# dmesg

5.查看邮件系统日志:/var/log/maillog

tail -f /var/log/maillog

6.查看用户登录日志

lastlog

这种日志数据用于记录 Linux 操作系统用户登录及退出系统的相关信息,包括用户名、
登录的终端、登录时间、来源主机、正在使用的进程操作等。
以下文件保存了用户登录、退出系统等相关信息
1)/var/log/lastlog :最近的用户登录事件
2)/var/log/wtmp :用户登录注销及系统开、关机事件
3)/var/run/utmp :当前登录的每个用户的详细信息
4)/var/log/secure :与用户验证相关的安全性事件 lastlog 引用的是/var/log/lastlog 文件中的信息,包括登录名、端口、最后登录时
间等。 [hadoop@master log]$ lastlog
Username Port From Latest
root pts/0 192.168.3.1 Fri May 27 15:06:44 +0800 2022
bin **Never logged in**
daemon **Never logged in**
adm **Never logged in**
lp **Never logged in**
sync **Never logged in** tty为控制台
pts为终端

last

last 列出当前和曾经登入系统的用户信息
它默认读取的是/var/log/wtmp 文件的信息。输出的内容包括:用户名、终端位置、登
录源信息、开始时间、结束时间、持续时间。注意最后一行输出的是 wtmp 文件起始记录的
时间。当然也可以通过 last -f 参数指定读取文件,可以是/var/log/btmp、/var/run/utmp
文件 [hadoop@master log]$ last
root pts/0 192.168.3.1 Fri May 27 15:06 still logged in
root tty1 Fri May 27 14:57 still logged in
reboot system boot 3.10.0-957.el7.x Fri May 27 14:56 - 16:13 (01:16)
root pts/0 192.168.3.1 Fri May 20 14:55 - crash (7+00:01)
root tty1 Fri May 20 14:54 - crash (7+00:02)
reboot system boot 3.10.0-957.el7.x Fri May 20 14:53 - 16:13 (7+01:20)
root pts/1 192.168.3.1 Fri May 6 17:12 - crash (13+21:41)
root pts/0 192.168.3.1 Fri May 6 16:47 - crash (13+22:05)
reboot system boot 3.10.0-957.el7.x Fri May 6 16:47 - 16:13 (20+23:26)

7.切换到 root 用户,使用命令 last -f /var/run/utmp,查看 utmp 文件

last -f /var/run/utmp

8.lastb 列出失败尝试的登录信息

[root@master ~]# lastb
root ssh:notty master Fri May 27 15:46 - 15:46 (00:00)
hadoop pts/0 Fri May 20 15:16 - 15:16 (00:00) btmp begins Fri May 20 15:16:55 2022

9.切换为 root 用户,执行 cat /var/log/secure 命令查看服务器登陆行为

[root@master ~]# cat /var/log/secure
May 27 15:46:16 master sshd[6899]: Failed password for root from 192.168.3.138 port 37584 ssh2
May 27 15:46:16 master sshd[6899]: Failed password for root from 192.168.3.138 port 37584 ssh2
May 27 15:46:16 master sshd[6899]: Connection closed by 192.168.3.138 port 37584 [preauth]

10.在 Hadoop MapReduce Jobs 中查看日志信息

[hadoop@master ~]$ cd /usr/local/src/hadoop/sbin
[hadoop@master sbin]$ ./mr-jobhistory-daemon.sh start historyserver 19888 看任务历史
8088看任务运行情况

[hadoop@master hadoop]$ hadoop jar  share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /input/data.txt /output

查看word count 运行状态

 cd /usr/local/src/hadoop/etc/hadoop

启动日志聚合

[hadoop@master ~]$ cd /usr/local/src/hadoop/etc/hadoop
[hadoop@master hadoop]$ vi yarn-site.xml <property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>

11.通过命令查看 Hadoop 日志

[hadoop@master ~]$cd /usr/local/src/hadoop/logs
[hadoop@master logs]$ ll

12.查看hbase

13.查看hive

cat /tmp/hadoophive.log

14.查看大数据平台主机告警信息

su - root
journalctl -p err..alert

15.查询ResourceManager 日记最新 1000 行且包含“info”关键字的告警信息

su - root
tail -1000f yarn-hadoop-resourcemanager-master.log |
grep info

16.查看 HBase 告警信息

http://master:60010/logLevel

执行命令

cd /usr/local/src/hbase/logs
tail -100f hbase-hadoop-master-master.log |grep INFO

17.查看 Hive 告警信息

cd /tmp/hadoop
tail -1000f hive.log |grep INFO

hadoop 查看日志的更多相关文章

  1. Hadoop错误日志

    1.错误日志:Directory /tmp/hadoop-root/dfs/name is in an inconsistent state: storage directory does not e ...

  2. 关于Web界面查看日志的权限问题

    关于Web界面查看日志的权限问题 @(Hadoop) 访问集群的8088端口,通过web ui查看作业日志时,发现没有权限查看,8088主界面右上角显示Logged in as : dr.who,即匿 ...

  3. hadoop yarn日志分离

    根据hdfs的auditlog以及fsimage分析,yarn的日志文件占用了10%-20%的rpc请求以及文件量,这对namenode的性能有比较大的影响,特别是当集群规模越来越大,会影响生产业务. ...

  4. ASP.NET Core应用中如何记录和查看日志

    日志记录不仅对于我们开发的应用,还是对于ASP.NET Core框架功能都是一项非常重要的功能特性.我们知道ASP.NET Core使用的是一个极具扩展性的日志系统,该系统由Logger.Logger ...

  5. 利用vim查看日志,快速定位问题

    起因 在一般的情况下,如果开发过程中测试报告了一个问题,我一般会这么做: 1.在自己的开发环境下重试一下测试的操作,看看能不能重现问题.不行转2 2.数据库连接池改成测试库的地址,在自己的开发环境下重 ...

  6. git查看日志

    git查看日志 git log -n 显示前N条记录 git log -3 退出log命令 直接输入: q git log --stat -n 显示提交的文件的简要的修改统计 $ git log -- ...

  7. Hive分析hadoop进程日志

    想把hadoop的进程日志导入hive表进行分析,遂做了以下的尝试. 关于hadoop进程日志的解析 使用正则表达式获取四个字段,一个是日期时间,一个是日志级别,一个是类,最后一个是详细信息, 然后在 ...

  8. linux常用查看日志命令

    转自:http://yinfeifei.iteye.com/blog/779217 1.cat命令: 功能:1)显示整个文件. 示例: $ cat fileName 2)把文件串连接后传到基本输出,如 ...

  9. 菜鸟学Linux命令:tail命令 查看日志

    tail 命令用于显示指定文件末尾内容,不指定文件时,作为输入信息进行处理. tail命令常用来查看日志文件.使用tail命令的-f选项可以方便的查阅正在改变的日志文件,tail -f filenam ...

  10. 【Linux】用less查看日志文件

    一般程序部署在Linux环境,查看日志时,一般用less满足大部分的需求. 列举.记录最常用的场景,代码以Tomcat日志文件catalna.out为例. > 直接查看文件 less catal ...

随机推荐

  1. 从数据库设计到性能调优,全面掌握openGemini应用开发最佳实践

    本文分享自华为云社区<DTSE Tech Talk × openGemini :从数据库设计到性能调优,全面掌握openGemini应用开发最佳实践>,作者:华为云开源. 在本期<从 ...

  2. ARM汇编基础

    1 GNU语法 1.1 GNU汇编 GNU 汇编语法适用于所有的架构,并不是 ARM 独享的,GNU 汇编由一系列的语句组成,每行一条语句,每条语句有三个可选部分,如下: label: instruc ...

  3. Java常用的三个方法 `wait ` `notify` `notifyAll`

    常用的三个方法 wait notify notifyAll wait();方法使当前线程进入等待状态,直到另一个线程调用该对象的notify()或notifyAll()方法来唤醒它 notify(); ...

  4. 新手入门html 表格 表单 超链接 图片

    超链接标签 <a></a> A里面的html属性 href="所要跳转到的目标连接" <a href="http:是必须加的"&g ...

  5. LeetCode 621. 任务调度器 (Java)

    题目: 给定一个用字符数组表示的 CPU 需要执行的任务列表.其中包含使用大写的 A - Z 字母表示的26 种不同种类的任务.任务可以以任意顺序执行,并且每个任务都可以在 1 个单位时间内执行完.C ...

  6. LeetCode 297. Serialize and Deserialize Binary Tree 二叉树的序列化与反序列化(C++/Java)

    题目: Serialization is the process of converting a data structure or object into a sequence of bits so ...

  7. go 1.6 废弃 io/ioutil 包后的替换函数

    go 1.6 废弃 io/ioutil  包后的替换函数 io/ioutil 替代 ioutil.ReadAll -> io.ReadAll ioutil.ReadFile -> os.R ...

  8. C#.NET WINFORM 缓存 System.Runtime.Caching MemoryCache

    C#.NET WINFORM 缓存 System.Runtime.Caching MemoryCache 工具类: using System; using System.Runtime.Caching ...

  9. APOLLO DEV环境列表无法显示解决,重启对应的Apollo服务

    APOLLO DEV环境列表无法显示解决,重启对应的Apollo服务 找到项目中的apollo-core jar包中的配置文件,查看dev.meta的服务器配置IP:端口 apollo-env.pro ...

  10. LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning、Lora、Prefix tuing等]

    LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning.Lora.Prefix tuing等] 由于LLM参数量都是在亿级以上,少则数十亿,多则 ...