永远选择相信同步原语

起因

qemu有一个可以让虚拟机(guest)使用宿主机(host)的音频播放的参数,-device audio。这个参数在x86上效果不错,但是在arm上效果不行,杂音很多,所以我们需要解决这个问题。方案是使用共享内存ivshmem。

具体的说,就是改写微软的官方样例驱动。虽然这些bug看起来简单,但是由于windows的奇怪特性,以及ARM上没有合适的调试工具,所以我们调试了很久很久……

调试的故事

调试的方法无非是打日志、看coredump、单步调试。

  1. 打日志

打日志可以用DbgPrint,它的输出可以用过DbgView看到。

DbgView有ARM架构版本的,也有x86版本的。虽然微软确实有x86转ARM指令集的功能,但是DbgView ARM版本异常容易崩溃,只能够用一小段时间,然后就会崩溃……据说qemu有串口输出日志的功能,但是由于我们要使用内核态,所以这个功能难以试出来。

  1. 看coredump

这个功能在x86上是可用的,在ARM上因为一些奇奇怪怪的问题,我们要用BcdEdit开启。大致只记得开启了测试模式,然后对照x86去修改其他bcd选项,然后又开了其他几个选项,不限制coredump大小,此时才有概率能够产生coredump。好在崩溃问题几乎是必现的,所以最终能够在几次重启之后正常获得coredump。

  1. 单步调试

据同事说,他曾在x86上用过这个功能对内核态驱动实体机单步调试,但是我们试过很多方法,都没有正常用的方法。

具体说,要使用单步调试,我们就需要网络,在进入系统前就必须要有网络。但是!我们只能在虚拟机中调试,而虚拟机中的驱动是在系统启动之后才加载,所以我们用不了这种方法。

当然,微软还提供了几个选择,比如可以用串口来单步调试,但是估计串口驱动也可能是在启动之后加载的,再加上在调试过程中我已经找到了崩溃的原因,所以就没有继续研究了。

所以,微软,我xxx

BUG1:缺乏同步原语导致的杂音

这是在录音这一部分遇到的bug。这里说的杂音是说,如果你给他录制人声,你能够听得出是这个人说的话,但是你听不清他说的是什么内容。如下图

也就是说,在真正写入数据之前就已经开始录音了,表现的效果就是听不清在说啥。

而播放是没有这个杂音问题的,也需要画图说明。

也就是说,播放的时候,在本次数据完整交给host播放之前,下一次数据是阻塞等待的。

所以录音有杂音,而播放无杂音,本质上就是同步原语的问题。我们无法修改windows内核的代码,所以没法用类似于播放的方法。

至于为什么非得要一个IO线程,就得看气人的安全措施protection ring

https://en.wikipedia.org/wiki/Protection_ring

这个ring中,ring2级别的无法访问ring0、1级别的内容。而我们的驱动运行在两个级别中,初始化的时候是0,初始化之后,读取、写入音频数据的时候是2,而在IO线程中是0,而IVSHMEM共享内存的ring级别就是0。

所以摆在我们面前的只有两个方案:

  1. 在IO队列与驱动之间加一个缓冲区

IO队列将所有能够读到的数据放入缓冲区,然后在windows请求读取的时候,之间从该缓冲区中读取。这样就可以解决这个问题了。

这个方案有几个问题。初始化的时候获取的ring级别是0吗?加入缓冲区导致的延迟可以接受吗?

  1. 让IVSHMEM可以在ring2级别中读取,规避掉IO线程

这是我们最终的方案,修改qemu的IVSHMEM源代码,让它能够跑在ring2级别中。具体修改的过程,只记得是IVSHMEM明明已经支持了这个功能,但是它没有开放给用户用,所以稍微加一个if-else就搞定了

BUG2:作为同步使用的WorkItem为NULL导致的驱动崩溃

这个bug似乎是和对象构造、析构相关的。它在播放与录音中都出现过,但是特点是:

只在arm上出现,不会在x86上出现

不过由于我们最后规避掉了IO线程,所以这个问题只在播放中出现过。

就是因为这个bug,我们花了大把时间在开启coredump上。coredump的问题已经讨论过了。最后修复它的方案就是分割驱动为一个录音驱动和一个播放驱动。虽然确实可以查出来该问题的根本并修复,但是我们发现用简单的方法处理了之后,在ARM上播放依然有杂音。所以我们当时推测是播放录音有相互干扰,所以分割为两个驱动,到此发现杂音没了。

如果时间够的话,我还真想排查出来WorkItem为什么会被释放。我们时间不够了,必须要赶紧做完这东西。

现在回想起来,说不定是ARM的内存屏障没有x86那么严格。我听说有一个公司将x86的java程序放arm上执行的时候就因为这个出现过毛病。

录音虚拟驱动杂音bug修复的更多相关文章

  1. ThinkPHP 3.2.3+ORACLE插入数据BUG修复及支持获取自增Id的上次记录

    TP+ORACLE插入数据BUG修复以及获取自增Id支持getLastInsID方法 这些天在做Api接口时候,发现用TP操作Oracle数据库,发现查询修改删除都能执行, 但一旦执行插入操作老是报错 ...

  2. 仿酷狗音乐播放器开发日志十九——CTreeNodeUI的bug修复二(附源码)

    转载请说明原出处,谢谢 今天本来打算把仿酷狗播放列表的子控件拖动插入功能做一下,但是仔细使用播放列表控件时发现了几个逻辑错误,由于我的播放 列表控件是基于CTreeViewUI和CTreeNodeUI ...

  3. OJ2.0userInfo页面Modify逻辑bug修复,search功能逻辑实现

    这周的主要任务:userInfo页面Modify逻辑bug修复,search功能逻辑实现. (一)Modify逻辑bug修复: 这里存在的bug就是在我们不重置password的时候依照前面的逻辑是不 ...

  4. cocos2d-x多分辨率和随后的自适应CCListView的bug修复

    cocos2d-x多分辨率自适配及因此导致的CCListView的bug修复 cocos2d-x是一款众所周知的跨平台的游戏开发引擎.因为其跨平台的特性.多分辨率支持也自然就有其需求. 因此.在某一次 ...

  5. android-misc-widgets四向(上下左右)抽屉bug修复版--转载

     android-misc-widgets四向(上下左右)抽屉bug修复版 2013-08-04 08:58:13 标签:bug down top panel slidingdrawer 原创作品,允 ...

  6. Spring+SpringMVC+MyBatis+easyUI整合基础篇(八)mysql中文查询bug修复

    写在前面的话 在测试搜索时出现的问题,mysql通过中文查询条件搜索不出数据,但是英文和数字可以搜索到记录,中文无返回记录.本文就是写一下发现问题的过程及解决方法.此bug在第一个项目中点这里还存在, ...

  7. 微信小程序(有始有终,全部代码)开发---跑步App+音乐播放器 Bug修复

    开篇语 昨晚发了一篇: <简年15: 微信小程序(有始有终,全部代码)开发---跑步App+音乐播放器 > 然后上午起来吃完午饭之后,我就准备继续开工的,但是突然的,想要看B站.然后在一股 ...

  8. Saiku Table展示数据合并bug修复(二十五)

    Saiku Table展示数据合并bug修复 Saiku以table的形式展示数据,如果点击了 非空的字段 按钮,则会自动进行数据合并,为空的数据行以及数据列都会自动隐藏掉. 首先我们应该定位问题: ...

  9. git bug修复

    在Git中,由于分支是如此的强大,所以,每个bug都可以通过一个新的临时分支来修复,修复后,合并分支,然后将临时分支删除. 当你接到一个修复一个代号101的bug的任务时,很自然地,你想创建一个分支i ...

  10. 高大上网站-CSS3总结1-图片2D处理以及BUG修复

    高大上网站-CSS3总结1-图片2D处理以及BUG修复 一,前言: 现在的前端UI相对JS来说,重视并不够. 但是CSS3提供的新特性,将现在的网站赤裸裸的划分为两类:一类还在写着老旧样式,或者通过b ...

随机推荐

  1. Task 笔记

    1.计时器类Stopwatch Stopwatch stopwatch=new Stopwatch() stopwatch.Start();//开始计时 stopwatch.Stop();//停止计时 ...

  2. 北京智和信通:IT资产全生命周期运维监控管理方案

    IT资产是企业开展正常业务运营和拓展不可或缺的资源,也是企业财产的重要载体.随着信息科技的快速发展,各企业对IT资产的依赖逐渐增强,IT资产的可靠性和有效性面临着愈来愈大的挑战.例如IT资产管理混乱, ...

  3. linux内核调试痛点之函数参数抓捕记

    1.linux内核调试工具crash并不能直接显示函数参数,而这个对调试又非常重要 下面是工作中一个实际的问题,我们的进程hang在如下一个内核栈中了,通过栈回溯可知是打开了一个nfs3的网盘文件或者 ...

  4. icache的dcache区别

    iCache是指指令缓存,DCache是指数据缓存.iCache是专门用于存储指令的高速缓存,DCache是用于存储数据的高速缓存.iCache用于存储指令,在CPU执行时将指令从iCache中读取, ...

  5. 从Windows 11 23H2升级至24H2后,Git操作提示文件所有权错误的3种有效解决方案

    从Windows 11 23H2升级至24H2后,Git操作提示文件所有权错误的3种有效解决方案 在升级至 Windows 11 24H2 后,使用 git add 等命令时,可能会遇到如下错误提示: ...

  6. Runtime类的简单应用

    1.描述 Runtime:描述运行时状态. 在整个JVM中,Runtime类是唯一一个与JVM运行状态有关的类,且默认提供一个该类的实例化对象. 由于在每一个JVM进程中只允许提供一个Runtime类 ...

  7. Linux新建用户无法登陆系统的解决方案

    前言 出现这个问题的原因,就是大家没有从基础开始学Linux,导致很多基础操作不会使用,遇到问题反而用搜索引擎搜索,得到一堆相似的答案,你就信了,因为重复就是权威.而你不清楚的是,这个答案是无数人复制 ...

  8. PostgresSQL创建一个只读用户

    create user readonlyuser with password 'R3333333341'; grant select on all tables in schema public to ...

  9. 【原创】dell戴尔笔记本充电头4530改装typeC口过程记录笔记本电源改装c口三路接线定义指南(图解)

    在淘宝淘一个备用笔记本电脑,要求便携能用,最重要便宜(如果不便宜买了就想高价卖了) 选择了xps13 L322x,键盘屏幕有瑕疵,打折下来价格170左右,换了个键盘20.整体重量1.3kg左右,大小A ...

  10. 一文彻底弄懂JUC工具包的Semaphore

    Semaphore 是 Java 并发包 (java.util.concurrent) 中的重要工具,主要用于控制多线程对共享资源的并发访问量.它可以设置"许可证"(permit) ...