一、介绍

最近一直在做有关JavaScriptCore的技术需求,上周发现一个问题,当在JavaScriptCore在垃圾回收时,项目会有一定几率发生崩溃。崩溃发生时调用堆栈如下:

图1 调用堆栈

先对上图中两个比较重要的堆栈过程做个说明:

图2 生成JSValue

1)、toJSValueInContext:方法是通过JSObjectMake 再生成一个JSValue。如上图中,最终返回的是一个JSValue,并且这个JSValue对self(PHOValue类型)做了一次强引用。

图3 该JSValue释放回调

2)、PHOObject_finalizeCallback 是JSValue的析构函数,当通过JSObjectMake生成的JS对象在释放时会调用该函数。在这个函数中,我们释放了之前所强引用的self(PHOValue类型)。当self释放时,self所强持有的对象A会被释放。进一步执行A的dealloc方法中,在dealloc方法中,我们再次调用了JSObjectMake函数生成其他的对象,并再次强持有了A对象,并将JSValue传入到JS中进行其他方法调用(如果不理解这个问题,请参考JSPatch对重写dealloc方法的处理,但是不同的是JSPatch 并不依赖垃圾回收)。

为了说明问题,特地画了个内存流程简图辅助理解:

图4 内存情况和流程说明

二、定位问题

为了定位问题,我们进行了很多猜想,在这里我们列举两个比较有代表性的猜想。

猜想1:在dealloc中不允许对正在执行dealloc的对象进行强引用

由于这个问题是有一定的概率出现,并且报出了Thread 1: EXC_BREAKPOINT (code=EXC_I386_BPT, subcode=0x0)这样的错误,因此我们最开始一直将精力集中在追查野指针上。崩溃发生在self进行dealloc的时机,但是在这个时机我们对self又做了一次强引用(见图2代码)。此时会对self的引用计数+1,因此猜测可能会重复触发self的dealloc。但是实际上当崩溃发生时,po操作查看self,context 等参数,发现所有的参数都是正常允许访问的。并且这与调用堆栈的现象并不相符,至少我们没有看到两次调用dealloc。因此这种猜想是不成立的。

猜想2:JavaScriptCore 在进行垃圾回收时不允许进行JSObjectMake

从调用堆栈来看,每次崩溃都发生在JSObjectMake之后,这是不是意味着垃圾回收时不能进行JSObjectMake操作呢?为了验证这个问题,我们在PHOObject_finalizeCallback函数中不做任何对象释放操作,仅仅执行一次JSObjectMake,

图5 回调中调用JSObjectMake

这样的改动就意味着,只要处于JavaScriptCore进行垃圾回收,就会立刻调用JSObjectMake。经过验证发现,果然在此处发生崩溃,并且是百分百复现,调用堆栈基本一致。因此可以说明我们的猜想是正确的。仔细想想这个问题,有经验的同学可能会感到细思极恐,因为垃圾回收机制并不受我们控制,我们在进行JSObjectMake无法保证一定不处于垃圾回收期间,那么理论上来说应该进行发生崩溃才对,为什么这个问题之前一直没有暴露出来呢?我们循环100000次创建对象并不断通过safari的调试功能人工触发垃圾回收,并没有发生崩溃。JavascriptCore存在两种垃圾回收方式,一种是同步回收,一种是异步回收,无论哪种方式,JavascriptCore对虚拟机有共有的堆(Heap,JavascriptCore的垃圾回收处理都在Heap.cpp中)都进行了加锁处理,换句话说就是在正常情况下JSObjectMake在垃圾回收时是无法访问堆的。

图6 JSCore的两种垃圾回收方式

而我们之所以发生崩溃是由于我们在对象在垃圾回收的回调中访问了堆,这个问题的伪代码如下:

图7 伪代码

三、寻找解决方案

既然基本定位到了问题的原因,那么下一步就要找方法去解决这个问题。问题的根源在于我们想在JS变量释放的时候释放它所间接持有的OC对象,如果在垃圾回收期间我们无法进行释放,那么是不是意味着只要我们获取到JavascriptCore的垃圾回收开始和结束回调就能避免这个问题了呢?查找JavascriptCore后发现,还真的有这个回调状态,只不过接口并没有对我们开放,Heap.h中存在一个添加观察者的接口。

图8 添加观察者

当即将进行垃圾回收和垃圾回收结束后会通知观察者:

图9 开始回调

图10 结束回调

那么现在问题来了,我们既然知道了回调方法,那么如何获得回调呢?在OC层面,我们可以通过runtime 进行hook,甚至在C语言层面我们也可以通过fb的fishhook来实现hook,在C++层面我们如何hook一个带命名空间的函数呢?(这个问题我们并没有实现思路,如果有人知道在iOS中如何hook一个C++函数,请及时留言指教)。在经历了一系列尝试后,我们放弃了hook C++函数的方法,转而寻求其他方法。回到最初的目的,实际上我们就是想保证垃圾回收之后再执行我们的JSObjectMake。因此GCD的延迟操作是一个很好的思路,但是到底延迟多长时间呢?这个方案似乎不是那么完美。那么还有什么操作是一个延迟释放的操作呢?__autoreleasing 应该是一个比较好的选择。当对象前被添加__autoreleasing修饰时,这个对象会被延迟到自动释放池释放时才被释放。当自动释放池释放时当前runloop一定是结束了,也就是说该垃圾回收一定是结束了(不可能一次垃圾回收分为两个runloop)。因此只需要将代码改为如下所图11示即可

图11 修改方案

四、总结

这个问题还是比较难定位的,首先是很难定位到垃圾回收导致问题,其次是很难找到比较好的回调,尤其是hook c++函数,我们做了很多次尝试都没有成功。如果有人有过在iOS系统中hook C++函数的实现方案,请不吝赐教,多谢多谢!

一次精疲力尽的改bug经历的更多相关文章

  1. 为什么程序员老在改 Bug,就不能一次改好吗?

    程序员的日常三件事:写Bug.改Bug.背锅.连程序员都自我调侃道,为什么每天都在加班?因为我的眼里常含Bug. 但是真的有这么多Bug要改吗?就不能一次改完吗? 程序员听这问题后要拍键盘了,还!真! ...

  2. 改bug的乐趣

    一直以来,我都不喜欢改bug,不管是自己的,还是别人的.因为我不相信自己的代码会出现问题,一旦出现问题我就会觉得很难堪,因为我觉得我的代码没什么问题.然后我就不知道该怎么来解决这些问题. 最近这一两次 ...

  3. 曹工改bug:cpu狂飙,old gc频繁,线程神秘死亡连环案件调查报告

    曹工改bug:cpu狂飙,old gc频繁,线程神秘死亡连环案件调查报告 前言 前两天,访问开发环境上一个java服务,发现一直转圈圈,因为我开着fiddler,可以看到的现象是,接口一直没返回:本来 ...

  4. 乐动ld06激光雷达sdk改bug记录分享

    前言: 工作中,有使用过乐动ld06款激光雷达,此款雷达将常规雷达的转动的电机部分内置于自己的保护罩内,减少了雷达本身转动积灰等其他外界影响,探测半径是12m,是一款不错的雷达. 不过今天的主要内容不 ...

  5. android软件简约记账app开发day08-时间对话框的书写+改bug,改bug

    android软件简约记账app开发day08-时间对话框的书写+改bug,改bug 绘制对话跨页面 在添加记账信息功能中,我提供了用户添加备注添加事件的功能,设计是点击时间会弹出一个时间对话框供用户 ...

  6. 一次数组越界的bug经历

    数组和指针都是C里面的好东西,但是一旦使用不当,真的会让人抓狂. 下面是写程序时遇到的一次数组越界的经历,感觉对以后写程序有点启发,所以记录下来. 起因: 我想用OLED动态显示一组浮点数,而且浮点数 ...

  7. git学习笔记09-bug分支-自己的分支改到一半了-要去改bug怎么办?

    当你接到一个修复一个代号101的bug的任务时,很自然地,你想创建一个分支issue-101来修复它,但是,等等,当前正在dev上进行的工作还没有提交: 并不是你不想提交,而是工作只进行到一半,还没法 ...

  8. 改BUG方法

    ---恢复内容开始--- 今天改了半天参数,后来发现原来是表设置错了,于是决定总结出遇到BUG时的方法,等下次再遇到BUG时,过一遍每个方法就会减少解决BUG的时间,话不多说,写 ①检查表.数据库是否 ...

  9. 11号了,还有三天上线-改bug

    +(NSDictionary *)replacedKeyFromPropertyName { return  @{ @"doctorId": @"id" }; ...

随机推荐

  1. java重写和重载

    方法的重载: 在一个类中的两个或两个以上的方法,他们方法名相同但是参数列表不同,这种方式称为方法的重载,方法的重载是实现多态性的方式之一. 参数列表不同指的是参数的个数不同或相同的个数但顺序不同或者类 ...

  2. eclipse 修改默认的author

    1. 在eclipse.ini中添加 -vmargs -Duser.name={author name} 记得一定要在-vmargs之后,否则无效. 2. 设置eclipse参数 windows--& ...

  3. 让微信,qq,uc浏览器使用全屏模式,全屏模式里,浏览器是不会上下左右滑动出现背景的

    <meta name="x5-fullscreen" content="true"> <meta name="full-screen ...

  4. QOpenGLTexture 两个纹理叠加

    如何做纹理混合? 方法是,定义多个QOpenGLTexture,然后在fragment shader中添加相应的变量,然后把texture bind到对应的uniform变量上. 废话不多说 text ...

  5. 自己用的reset.css,大部分转载,加上自己常用的设置

    @charset "UTF-8";/*KISSY CSS Reset理念:清除和重置是紧密不可分的特色:1.适应中文 2.基于最新主流浏览器维护:玉伯(lifesinger@gma ...

  6. 洛谷P2617 Dynamic Ranking(主席树,树套树,树状数组)

    洛谷题目传送门 YCB巨佬对此题有详细的讲解.%YCB%请点这里 思路分析 不能套用静态主席树的方法了.因为的\(N\)个线段树相互纠缠,一旦改了一个点,整个主席树统统都要改一遍...... 话说我真 ...

  7. Django入门-基本数据库API

    # 现在系统里还没有 Question 对象 >>> Question.objects.all() <QuerySet []> # 创建新 Question # 在 se ...

  8. Zabbix 监控 Docker容器

    我们可以通过Python提供的模块docker来取各个docker容器的监控参数.参考文档:http://docker-py.readthedocs.io/en/stable/containers.h ...

  9. El表达式的判断字符串的长度和截取,日期时间的格式化

    <c:if test="${fn:length(each.wii_name) >= 20}"> ${fn:substring(each.wii_name, 0,2 ...

  10. nginx学习之rewrite

    rewrite 语法学习 什么是rewrite nginx的rewrite主要功是实现URL地址重写.nginx的rewrite规则需要PCRE的支持,既可以通过Perl兼容正则表达式进行规则匹配.n ...