【转载】Linux虚拟化KVM-Qemu分析(九)之virtio设备
作者:LoyenWang
出处:https://www.cnblogs.com/LoyenWang/
公众号:LoyenWang
版权:本文版权归作者和博客园共有
转载:欢迎转载,但未经作者同意,必须保留此段声明;必须在文章中给出原文连接;否则必究法律责任
背景
Read the fucking source code!
--By 鲁迅A picture is worth a thousand words.
--By 高尔基
说明:
- KVM版本:5.9.1
- QEMU版本:5.0.0
- 工具:Source Insight 3.5, Visio
- 文章同步在博客园:
https://www.cnblogs.com/LoyenWang/
新的一年, 大家牛起来!
祝小姐姐们:
落雁沉鱼 兰质蕙心 明眸皓齿 螓首蛾眉 天生丽质 天香国色 杏脸桃腮 煦色韶光 涎玉沫珠 宜嗔宜喜 远山芙蓉 艳色绝世 余霞成绮 阿娇金屋 逞娇呈美 国色天香 花颜月貌 绝色佳人 暗香盈袖 闭月羞花 倾国倾城 温婉娴淑 千娇百媚 仪态万千...
祝男的:
新年好。
1. 概述
先来张图:
- 图中罗列了四个关键模块:
Virtio Device
、Virtio Driver
、Virtqueue
、Notification(eventfd/irqfd)
; Virtio Driver
:前端部分,处理用户请求,并将I/O请求转移到后端;Virtio Device
:后端部分,由Qemu来实现,接收前端的I/O请求,并通过物理设备进行I/O操作;Virtqueue
:中间层部分,用于数据的传输;Notification
:交互方式,用于异步事件的通知;
想在一篇文章中写完这四个模块,有点too yong too simple
,所以,看起来又是一个系列文章了。
本文先从Qemu侧的virtio device入手,我会选择从一个实际的设备来阐述,没错,还是上篇文章中提到的网络设备。
2. 流程分析
在Qemu的网卡虚拟化时,通常会创建一个虚拟网卡前端和虚拟网卡后端,如下图:
- 在虚拟机创建的时候指定参数:
-netdev tap, id = tap0, -device virtio-net-pci, netdev=tap0
; - 创建一个
Tap
网卡后端设备; - 创建一个
Virtio-Net
网卡前端设备; - 网卡前端设备和后端设备进行交互,最终与Host的驱动完成数据的收发;
全文围绕着Tap
设备的创建和Virtio-Net
设备的创建展开。
入口流程如下:
- Qemu的代码阅读起来还是比较费劲的,各种盘根错节,里边充斥着面向对象的思想,先给自己挖个坑,后续会专题研究的,
this is for you, you have my words.
; - 图中与本文相关的有三个模块:1)模块初始化;2)网络设备初始化;3)设备初始化;
- Qemu中设备模拟通过
type_init
先编译进系统,在module_call_init
时进行回调,比如图中的xxx_register_types
,在这些函数中都是根据TypeInfo
类型信息来创建具体的实现信息; net_init_client
用来创建网络设备,比如Tap
设备;device_init_func
根据Qemu命令的传入参数创建虚拟设备,比如Virtio-Net
;
- Qemu中设备模拟通过
下边进入细节,the devil is in the details
。
3. tap创建
从上文中,我们知道,Tap
与Virtio-Net
属于前后端的关系,最终是通过结构体分别指向对方,如下图:
NetClientState
是网卡模拟的核心结构,表示网络设备中的几个端点,两个端点通过peer
指向对方;
创建Tap设备的主要工作就是创建一个NetClientState
结构,并添加到net_clients
链表中:
函数的调用细节如下图:
- 处理流程只关注了核心的处理流程,整个过程有很多关于传入参数的处理,选择性忽略了;
net_tap_init
:与Host的tun
驱动进行交互,其实质就是打开该设备文件,并进行相应的配置等;net_tap_fd_init
:根据net_tap_info
结构,创建NetClientState
,并进行相关设置,这里边net_tap_info
结构体中的接收函数指针用于实际的数据传输处理;tap_read_poll
用于将fd添加到Qemu的AioContext中,用于异步响应,当有数据来临时,捕获事件并进行处理;
以上就是Tap后端的创建过程,下文将针对前端创建了。
4. virtio-net创建
这是一个复杂的流程。
4.1 数据结构
Qemu中用C语言实现了面向对象的模型,用于对设备进行抽象,精妙!
针对Virtio-Net设备,结构体及拓扑组织关系如下图:
DeviceState
作为所有设备的父类,其中派生了VirtIODevice
和PCIDevice
,而本文研究的Virtio-Net
派生自VirtIODevice
;- Qemu中会虚拟一个PCI总线,同时创建
virtio-net-pci
,virtio-balloon-pci
,virtio-scsi-pci
等PCI代理设备,这些代理设备挂载在PCI总线上,同时会创建Virtio总线,用于挂载最终的设备,比如VirtIONet
; - PCI代理设备就是一个纽带;
4.2 流程分析
与设备创建相关的三个函数,可以从device_init_func
入口跟踪得知:
- 当Qemu命令通过
-device
传入参数时,device_init_func
会根据参数去查找设备,并最终调用到该设备对应的类初始化函数、对象初始化函数、以及realize函数; - 所以,我们的分析就是这三个入口;
4.2.1 class_init
- 在网卡虚拟化过程中,参数只需要指定PCI代理设备即可,也就是
-device virtio-net-pci, netdev=tap0
,从而会调用到virtio_net_pci_class_init
函数; - 由于实现了类的继承关系,在子类初始化之前,需要先调用父类的实现,图中也表明了继承关系以及调用函数顺序;
- C语言实现继承,也就是将父对象放置在自己结构体的开始位置,图中的颜色能看出来;
4.2.2 instance_init
类初始化结束后,开始对象的创建:
- 针对
Virtio-Net-PCI
的实例化比较简单,作为代理,负责将它的后继对象初始化,也就是本文的前端设备Virtio-Net
;
4.2.3 realize
realize
的调用,比较绕,简单来说,它的类继承关系中存在多个realize
的函数指针,最终会从父类开始执行,一直调用到子类,而这些函数指针的初始化在什么时候做的呢?没错,就是在class_init类初始化的时候,进行了赋值,细节不表,结论可靠;- 最终的调用关系就如图了;
到目前为止,我们似乎都还没有看到Virtio-Net
设备的相关操作,不用着急,已经很接近真相了:
virtio_net_pci_realize
函数,会触发virtio_device_realize
的调用,该函数是一个通用的virtio设备实现函数,所有的virtio设备都会调用,而我们的前端设备Virtio-Net
也是virtio设备;virtio_net_device_realize
就到了我们的主角了,它进行了virtio通用的设置(后续在数据通信中再分析),还创建了一个NetClientState
端点,与Tap
设备对应,分别指向了对方,惺惺相惜,各自安好;virtio_bus_device_plugged
表示设备插入总线时的处理,完成的工作就是按照PCI总线规划,配置各类信息,以便与Guest OS中的virtio驱动交互,后续的文章再分析了;
本文基本捋清了虚拟网卡前端设备和后端设备的创建过程,完成的工作只是绑定了彼此,数据交互以及通知机制,留给后续吧。
参考
《 Virtual I/O Device (VIRTIO) Version 1.1》
https://www.redhat.com/en/blog/virtio-devices-and-drivers-overview-headjack-and-phone
欢迎关注个人公众号,不定期更新技术文章。
【转载】Linux虚拟化KVM-Qemu分析(九)之virtio设备的更多相关文章
- [转载]Linux 线程实现机制分析
本文转自http://www.ibm.com/developerworks/cn/linux/kernel/l-thread/ 支持原创.尊重原创,分享知识! 自从多线程编程的概念出现在 Linux ...
- KVM/QEMU/qemu-kvm/libvirt 概念全解
目录 目录 前言 KVM QEMU KVM 与 QEMU qemu-kvm Libvirt Libvirt 在 OpenStack 中的应用 前言 如果是刚开始接触虚拟机技术的话, 对上述的概念肯定会 ...
- 【原创】Linux虚拟化KVM-Qemu分析(三)之KVM源码(1)
背景 Read the fucking source code! --By 鲁迅 A picture is worth a thousand words. --By 高尔基 说明: KVM版本:5.9 ...
- Linux虚拟化技术KVM、QEMU与libvirt的关系(转)
说明:个人理解,KVM是内核虚拟化技术,而内核是不能使用在界面上使用的,那么此时QEMU提供了用户级别的使用界面,相互辅助.当然,单独使用QEMU也是可以实现一整套虚拟机,不过QEMU+KVM基本是标 ...
- 【原创】Linux虚拟化KVM-Qemu分析(九)之virtio设备
背景 Read the fucking source code! --By 鲁迅 A picture is worth a thousand words. --By 高尔基 说明: KVM版本:5.9 ...
- 关于Linux虚拟化技术KVM的科普 科普三(From OenHan)
http://oenhan.com/archives,包括<KVM源代码分析1:基本工作原理>.<KVM源代码分析2:虚拟机的创建与运行>.<KVM源代码分析3:CPU虚 ...
- 关于Linux虚拟化技术KVM的科普 科普二(KVM虚拟机代码揭秘)
代码分析文章<KVM虚拟机代码揭秘--QEMU代码结构分析>.<KVM虚拟机代码揭秘--中断虚拟化>.<KVM虚拟机代码揭秘--设备IO虚拟化>.<KVM虚拟 ...
- KVM+QEMU虚拟化概念
概念: KVM,即Kernel-basedvirtual machine,由redhat开发,是一种开源.免费的虚拟化技术.对企业来说,是一种可选的虚拟化解决方案. 定义:基于Linux内核的虚拟机 ...
- KVM,QEMU核心分析
现在的问题是学习虚拟化软件KVM相关实施原则.处理,的源代码的分析总结,,若有不对的地方,希望大家提出. 因为有一些代码结构图或者是架构图上传比較麻烦.所以博文都放在了自己的个人博客上.麻烦大家移步查 ...
- 【原创】Linux虚拟化KVM-Qemu分析(一)
背景 Read the fucking source code! --By 鲁迅 A picture is worth a thousand words. --By 高尔基 说明: KVM版本:5.9 ...
随机推荐
- MySQL(四)用户与权限管理
用户与权限管理 用户管理 MySQL用户分为普通用户和root用户,提供了许多语句来管理包括登录.退出MySQL服务器.创建用户.删除用户.密码管理和权限管理等内容. 登录MySQL服务器 mysql ...
- redission分布式redis锁使用
public void lock(String key, List<Long> idx) { if (CollectionUtils.isEmpty(idx)) { return; } i ...
- (一)pyahocorasick和marisa_trie,字符串快速查找的python包,自然语言处理,命名实体识别可用的高效包
Pyahocorasick Pyahocorasick是一个基于AC自动机算法的字符串匹配工具.它可以用于快速查找多个短字符串在一个长字符串中的所有出现位置.Pyahocorasick可以在构建状态机 ...
- [C++基础入门] 4、 程序流程结构
文章目录 4 程序流程结构 4.1 选择结构 4.1.1 if语句 4.1.2 三目运算符 4.1.3 switch语句 4.2 循环结构 4.2.1 while循环语句 4.2.2 do...whi ...
- flink HelloWorld 之词频统计
最近也在跟着学习flink,也是费了一点功夫才把开发环境都搭建了起来,做了一个简单的词频统计的demo- 准备工作 首先我们需要搭建需要的flink开发环境,我这里使用的是IDEA作为我的开发工具,所 ...
- i < sqrt(n) 和 i*i < n 那一种写法更加高效?
这两种写法效率依赖处理器.编译器和标准库.一般来说循环内的重复操作的性能差于循环外的单次操作. 参考文献 Which is more efficient to use in a for loop, i ...
- Java web文件服务器的简单实现
先分享一个好用的聚合搜索引擎,https://www.tomfind.com/ ,支持谷歌.百度.搜狗.bing.360一键切换,支持网页.音乐.购物.视频搜索.支持抖音.快手.哔哩哔哩.微信.头条. ...
- 【Python基础】列表的基本使用
列表是由一系列元素组成的有序集合.列表可以包含任意类型的元素.它是可变的,可以随时添加.删除.替换元素.列表可以使用方括号([])括起来,并使用逗号分隔元素. list1 = [1, 2, 3, &q ...
- 在基于nuxt的移动端页面中引用mint UI的popup组件之父子组件传值
最近在做移动端的wap页面,考虑到要做SEO,所以选定了nuxt+vue+mint ui. 有一个需求是这样的,点击头部菜单栏,出现一个气泡,点击返回首页. 由于一些页面没有统一引用mint的mt-h ...
- 2022-03-06:金币路径。 给定一个数组 A(下标从 1 开始)包含 N 个整数:A1,A2,……,AN 和一个整数 B。 你可以从数组 A 中的任何一个位置(下标为 i)跳到下标 i+1,i+
2022-03-06:金币路径. 给定一个数组 A(下标从 1 开始)包含 N 个整数:A1,A2,--,AN 和一个整数 B. 你可以从数组 A 中的任何一个位置(下标为 i)跳到下标 i+1,i+ ...