嵌入式/X86下linux系统死机及内存优化
一. CPU 过高或死锁导致系统卡死
1. CPU占用过高
(1)开线程太多导致CPU占用过高,系统卡死
解决:优化应用层业务逻辑,有些业务不必开线程就不开
(2)频繁清缓存导致读spi-flash频繁,引起CPU过高
解决:在内核中文件系统部分进行处理,不去清缓存,然后在应用层用后台服务进程清缓存。这样可能导致系统内存不够用,这样就需要再对系统内存进行优化
2. CPU死锁
(1)Spinlock+死等导致死锁
(2)应用层pthread_mutex_lock死锁
3. CPU过热导致系统启动失败
(1)CPU超过BIOS的设定阈值导致内核启动失败
(2)CPU确实太热,加风扇、扇热片,或者对结构进行优化
4. 灰尘太多、环境恶劣等因素导致电源异常
二. 内存问题导致系统死机
1. 虚拟内存耗尽
(1)线程开太多,导致虚拟内存到达3G,出现主程序挂死,但系统不会死机
确认方法:假如系统进程号为pid,那么查看/proc/pid/status可以看到开的线程数及虚拟、物理内存。另外用top也可以看到虚拟内存或物理内存,有的Busybox编译问题,看不到物理内存占用情况,这样就要根据/proc/pid/status,或者查看如下字段:
cat /proc/pid/stat | awk -F" " '{print "virt:"$23}'
cat /proc/pid/stat | awk -F" " '{print "rss:"$24}'
解决方法:调整应用层策略,可不开的线程就不开
2. 物理内存耗尽(OOM)
(1)这种一般都是内存泄露问题
确认方法:
A. 通过top确认物理内存增长情况
B. 通过/proc/pid/status统计物理内存增长情况,或者/proc/pid/stat
解决方法:
(1)通过review malloc/free来解决
(2)通过工具检查valgrind、oprofile、perf等工具
(3)静态检查工具:flint、pclint
(2)确实物理内存不够用
解决方法:内存优化
3. 内存碎片过多,伙伴系统大块内存耗尽
这是系统会出现内存OOM,通过OOM或者/proc/sysrq-tigger可以看到伙伴系统、slab缓存的内存分布情况,根据使用地方进行优化。
我们出现过一个问题,CPU过高时产生大量内存碎片,而CPU过高是因为清缓存后CPU读flash导致,CPU读flash到内存会产生内存碎片,这样可以通过CPU清缓存的时机来解决,或者就不去清缓存。
其他内存碎片处理方法:
三. 硬件问题
(1)外接串口一端悬空产生天线效应导致串口中断过多
(2)SIO信号干扰导致大量中断产生,系统卡住
四. 开机速度优化方法
(1)精简内核业务,没有用到的模块可以不编译进去,这种模块还是很多的
(2)将可以开机后加载的驱动编译成ko单独加载
(3)通过编译器编译选项优化
(4)增加flash的读取速度,调整flash时钟
(5)使用非压缩内核
(6)关闭串口打印输出
(7)XIP技术(eXecute In Place)
内核XIP:直接在flash/ROM中运行内核,或者使用非压缩内核vmlinux肯定比zImage、uImage快
文件系统XIP:比如cramfs文件系统,只把用到的部分读取到RAM中,要比jiffs2节省时间
(8)图形界面系统采用直接写framebuff,而不用C++/QT的GUI
五. 内存优化方法
(1)物理内存实在不够,即使没有内存泄露也不够,考虑交换内存
(2)优化数据结构,合理申请内存
(3)在适当的时间进行内存回收
(4)堆内存最小单位为16字节所以应尽量减少小块内存的申请,避免内存浪费
(5)调整M_MMAP_THRESHOLD,降低mmap的门槛,会降低内存空洞的风险,但也会增加系统调用,降低性能。
(6)调整M_TRIM_THRESHOLD,减少堆顶连续内存门槛,释放更多的堆顶内存。
(7)使用ptmalloc工具、oprofile、valgrind、perf等工具优化
嵌入式/X86下linux系统死机及内存优化的更多相关文章
- x64架构下Linux系统函数调用
原文链接:https://blog.fanscore.cn/p/27/ 一. 函数调用相关指令 关于栈可以看下我之前的这篇文章x86 CPU与IA-32架构 在开始函数调用约定之前我们需要先了解一下几 ...
- 嵌入式X86运行linux及QtEmbedded+触摸屏(X86PC104+Xlinux+QtE+触摸屏解决办法)
嵌入式X86运行linux及QtEmbedded+触摸屏(X86PC104+Xlinux+QtE+触摸屏解决办法) QQ:5724308 邮箱:sankye@163.com
- win10 vmware下Linux系统联网
本来,这个问题网上资源很多的,但是就因为多,就变得杂了,对于许多新手,并不理解为啥,故记录下来方便以后使用.此处我采用配置VWmare虚拟网关(上学期刚刚学计算机网络,正好可以复习下).关于虚拟机下L ...
- Linux 操作系统死机故障处理方法总结
通常在出现系统崩溃后,大家会担心再次出现故障,但是发现系统各日志中并没有记录到任何死机前后的信息,无法分析故障原因,认为已经无药可救.但是,实际上,Linux 有多种机制来保证发生系统崩溃后,可以获取 ...
- 高并发情况下Linux系统及kernel参数优化
众所周知在默认参数情况下Linux对高并发支持并不好,主要受限于单进程最大打开文件数限制.内核TCP参数方面和IO事件分配机制等.下面就从几方面来调整使Linux系统能够支持高并发环境. Iptabl ...
- 解决Oracle+weblogic系统死机的问题
前段时间发布的系统(Oracle+weblogic)频繁挂掉,每天早上9点.下午2点高峰期就挂,纠结了很长时间,最终解决,方法描述下. 执行select count(*),status from v$ ...
- Windows10下Linux系统的安装和使用
WSL 以往我都是直接安装VirtualBox,然后再下载Linux系统的ISO镜像,装到VirtualBox里运行. 改用Win10系统后,了解到了WSL(Windows Subsystem for ...
- 虚拟机下Linux系统如何设置IP地址
虚拟机下Linux系统设置IP地址三种方法 文章来源:https://jingyan.baidu.com/article/ea24bc399ffeb9da62b3318f.html 工具/原料 V ...
- 删除一个cjson导致系统死机
一个未使用,未分配的cjson指针应该被删除,如果尝试删除一个 未分配,未启用的cjson将导致内存出错,死机.
随机推荐
- Windows学习总结(3)——成为电脑高手必备的cmd命令大全
曾经看电影和电视里面电脑黑客快速敲击电脑键盘,一行行命令在电脑屏幕闪过,一个回车过后,一排排英文象走马灯一样在屏幕上转瞬即逝,那才是我们梦寐以求的高手,有木有!实际上,不光是黑客和系统维护人员,一般的 ...
- 洛谷 P1400 塔
P1400 塔 题目描述 有N(2<=N<=600000)块砖,要搭一个N层的塔,要求:如果砖A在砖B上面,那么A不能比B的长度+D要长.问有几种方法,输出 答案 mod 10000000 ...
- C# XML类学习整理(待补)
一.读取xml文件内容: #region "获取xml文件内容" //将xml文件加载进来 XDocument xdoc = XDocument.Load("F:\\6. ...
- c++操作当前窗体句柄
句柄 这一概念是MFC里的一个类.MFC有专门的函数来获取窗体句柄. HWND hwnd; hwnd=CreateWindow("my own windowshandle",&qu ...
- POJ 题目1145/UVA题目112 Tree Summing(二叉树遍历)
Tree Summing Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 8132 Accepted: 1949 Desc ...
- LinearLayout -设置负值属性
1.我们调整两个控件的位置的时候,数值不仅仅是正数,负的也行,这时候只不过是跑到相对位置的另一边去了,例如 <ImageView android:id="@+id/image" ...
- android hander
http://www.cnblogs.com/plokmju/p/android_Handler.html 前言 Android的消息传递机制是另外一种形式的“事件处理”,这种机制主要是为了解决And ...
- JS怎么判断数组类型?
1.判断对象的constructor是否指向Array,接着判断特殊的属性length,splice等.[应用的是constructor的定义:返回对象所对应的构造函数.] eg: [].constr ...
- 【hdu 6000】Wash
[链接] 我是链接,点我呀:) [题意] 在这里输入题意 [题解] 因为每件衣服都是没有区别的. 只有洗衣机不同会影响洗衣时间. 那么我们把每台洗衣机洗衣的时间一开始都加入到队列中. 比如{2,3,6 ...
- 【CS Round #43 A】Expected Dice
[链接]https://csacademy.com/contest/round-43/task/expected-dice/ [题意] 大水题 [题解] 把36种可能的结果都存下来. 然后把重复出现的 ...