OVS 流表offload
原文链接:https://www.dazhuanlan.com/2019/12/31/5e0af1858dada/
最近开始调研网卡的OVS流表offload功能,所以目前查看一下OVS这块是怎么做的。
从上面可以看到OVS主要通过netlink发送给网口,接下来我们看一下网卡驱动做了一些什么,因为在做Mellanox家的网卡,所以这里查看代码就查看mlx5_core的驱动代码。
首先是开启offload,Mellanox有两种方案开启offload,设置方法不一样,但是实质是一致的,就是把eswitch_mode配置为switchdev,分别看一下:
第一种配置方法为devlink dev eswitch set pci/${PCI_ADDR} mode switchdev
,这是中间一些版本的配置,它对应的代码路径如下:
eswitch_mode_set-->mlx5_devlink_eswitch_mode_set-->esw_offloads_start-->mlx5_eswitch_enable_sriov
,我查看的代码没有看到地方调用。
第二种配置方法为echo switchdev > /sys/kernel/debug/mlx5/${PCI_ADDR}/compat/mode
,这是后面普遍的一种配置方法,它对应的代码路径如下:
esw_compat_fops-->write-->esw_compat_write-->write_u16-->mlx5_devlink_eswitch_mode_set-->esw_offloads_start-->mlx5_eswitch_enable_sriov
mlx5_remove_dev_by_protocol
首先从MLX5_INTERFACE_PROTOCOL_IB协议中移除设备mlx5_add_dev_by_protocol
将设备添加到协议MLX5_INTERFACE_PROTOCOL_IB中esw_offloads_init
初始化offload相关的一些表和repsentor端口esw_create_offloads_fdb_tables
创建FDB表esw_create_offloads_table
创建转发表esw_create_vport_rx_group
创建接收组esw_offloads_load_reps
加载repsentor端口
esw_create_tsar
vport的QoS管理esw_enable_vport
使能vport
配置OVS支持offload
配置OVS的流表offload功能的命令如下:
1 |
ovs-vsctl set Open_vSwitch . Other_config:hw-offload=true |
utilities/ovs-vsctl.c
实现我们不看了。我们主要看一下vswitchd是做了什么操作。
vswitchd/ovs-vswitchd.c
main-->bridge_run-->netdev_set_flow_api_enabled-->netdev_tc_init_flow_api
主要是设置去创建或者删除一条TC规则,如果是添加则类似/sbin/tc qdisc add dev <devname> handle ffff: ingress
,如果是删除则类似/sbin/tc qdisc del dev <devname> handle ffff: ingress
。
OVS offload流表下发
OVS相关部分
当报文不匹配的时候,会将报文上报,会调用udpif_upcall_handler
udpif_upcall_handler-->recv_upcalls-->handle_upcalls-->dpif_operate-->dpif_netlink_operate-->try_send_to_netdev-->parse_flow_put-->netdev_flow_put-->netdev_tc_flow_put
- 首先判定是不是tunnel,是的话需要存储五元组
- 是vlan的话,记录vid和mask
- 记录源目的MAC和掩码
- 记录五元组及其掩码
- 检测以上记录的信息是否有不支持的,还是有挺多不支持的,具体查看函数
test_key_and_mask
- 记录action,目前支持的是output,push_vlan,pop_vlan,set,set_mask
- 调用
tc_replace_flower
将以上记录的信息进行转换,然后通过netlink发送给端口。
网卡驱动相关
前面ovs调用tc_replace_flower
时候会触发kernel调用函数tc_ctl_tfilter
,路径如下:
tc_ctl_tfilter-->fl_change-->fl_hw_replace_filter-->mlx5e_rep_ndo_setup_tc-->mlx5e_configure_flower-->mlx5e_tc_add_fdb_flow-->mlx5_eswitch_add_offloaded_rule
mlx5e_configure_flower
parse_cls_flower
解析ovs传递过来的流表中match的key信息parse_tc_fdb_actions
解析ovs传递过来的流表中action信息mlx5e_tc_add_fdb_flow
主要是讲match和action添加到fdb流表- 后面先不看了,multipath的那些操作
mlx5e_tc_add_fdb_flow
- 如果action包含encap,那么调用
mlx5e_attach_encap
生成vxlan所需要的报文头信息 mlx5_eswitch_add_vlan_action
添加vlan的actionmlx5_eswitch_add_offloaded_rule
添加offloaded规则
mlx5_eswitch_add_offloaded_rule-->mlx5_add_flow_rules-->_mlx5_add_flow_rules
主要是向firmware发送指令添加offload规则。
这块关联比较多,不太好看,以后遇到问题再去查看。
dump flows
一般是两种命令可以展示datapath的流表,他们的区别主要是能不能dump别的datapath,主要实现都是一致的,所以我们只看一个相关的代码,因为个人认为ovs-appctl命令更好一些,所以就看这个的代码。
1 |
ovs-dpctl dump-flows [type=offloaded/ovs] |
命令相关的代码就不看了,因为ovs-appctl调用的命令都需要在ovs-vswitchd中通过函数unixctl_command_register
进行注册。我们这里直接查看注册的dpctl相关的命令。
代码路径如下,文件起始于ovs-vswitchd.c
main-->bridge_run-->bridge_reconfigure-->bridge_add_ports-->bridge_add_ports__-->iface_create-->iface_do_create-->netdev_open-->construct-->dpif_create_and_open-->dpif_open-->do_open-->dp_initialize-->dpctl_unixctl_register-->dpctl_unixctl_handler-->dpctl_dump_flows
dpctl_dump_flows
- 首先做参数检测,保证参数合理性
dpif_flow_dump_create-->dpif_netlink_flow_dump_create
主要有两个事情,一个就是nl_dump_start
,原来的dump ovs的流表,另一个就是dump offloaded流表,用的函数start_netdev_dump
- 遍历所有满足类型条件的流表,并且根据filter进行过滤。
OVS 流表offload的更多相关文章
- OVS流表table之间的跳转
OVS流表table之间的跳转 前言 今天在帮学弟解决问题的时候,遇到一个table0.table1之间的微妙小插曲,引起了注意,后来查了一下资料发现原因了. 问题描述 wpq@wpq:~$ sudo ...
- OVS 内核KEY值提取及匹配流表代码分析
原文链接:http://ry0117.com/2016/12/24/OVS内核KEY值提取及匹配流表代码分析/ 当开启OVS后,创建datapath类型为system的网桥并他添加相关接口,OVS网桥 ...
- Neutron 理解 (4): Neutron OVS OpenFlow 流表 和 L2 Population [Netruon OVS OpenFlow tables + L2 Population]
学习 Neutron 系列文章: (1)Neutron 所实现的虚拟化网络 (2)Neutron OpenvSwitch + VLAN 虚拟网络 (3)Neutron OpenvSwitch + GR ...
- OVS中arp响应的流表的实现
总结: 1.br-int 流表总体是按照Normal 的方式,即常规的交换机的转发方式进行转发.而br-tun 交换机则主要按照流表的方式进行转发. 2.一般情况下,VM发出的ARP请求,会在该VM的 ...
- OVS 精确删除流表
OVS 精确删除流表 前言 今天看了sdnlab小姐姐的mininet教程之后,看到有一个下流表的操作,优先级没能下成功,然后回来实验一下,这个问题是解决了,不过遇到了一个小问题,ovs如何精确删除流 ...
- ovs源码阅读--流表查询原理
背景 在ovs交换机中,报文的处理流程可以划分为一下三个步骤:协议解析,表项查找和动作执行,其中最耗时的步骤在于表项查找,往往一个流表中有数目巨大的表项,如何根据数据报文的信息快速的查找到对应的流表项 ...
- openVswitch(OVS)源代码分析之工作流程(flow流表查询)
原文链接: openVswitch(OVS)源代码分析之工作流程(flow流表查询)
- [ovs] 编写openflow流表的文档指引
首先,openflow流表都是使用ovs-ofctl命令进行添加的. 1. 看 ovs-ofctl 的man手册 man ovs-ofctl 或者,这个地方也有:http://www.openvswi ...
- openflow流表分析(草稿)
OVS bridge 有两种模式:“normal” 和 “flow”.“normal” 模式的 bridge 同普通的 Linux 桥,而 “flow” 模式的 bridge 是根据其流表(flow ...
随机推荐
- 使用@ControllerAdvice处理异常
在Spring 3.2中,新增了@ControllerAdvice.@RestControllerAdvice 注解,可以用于定义@ExceptionHandler.@InitBinder.@Mode ...
- Oracle 忘记密码 如何修改
原文链接:https://jingyan.baidu.com/article/358570f6aaa1efce4724fcdf.html ️打开运行窗口 ️输入sqlplus "/ as s ...
- 不想得手指关节炎?帮你提炼IDEA常用代码补全操作
一.常用的代码补全操作 1..for和.fori(for 循环遍历) 输入args.for回车(args是一个数组或集合类),则会生成for循环遍历: 输入args.fori回车,则会生成带有索引的f ...
- CF R631 div2 1330 E Drazil Likes Heap
LINK:Drazil Likes Heap 那天打CF的时候 开场A读不懂题 B码了30min才过(当时我怀疑B我写的过于繁琐了. C比B简单多了 随便yy了一个构造发现是对的.D也超级简单 dp了 ...
- 海华大赛第一名团队聊比赛经验和心得:AI在垃圾分类中的应用
摘要:为了探究垃圾的智能分类等问题,由中关村海华信息研究院.清华大学交叉信息研究院以及Biendata举办的2020海华AI垃圾分类大赛吸引了大量工程师以及高校学生的参与 01赛题介绍 随着我国经济的 ...
- html标签知识(无表单、表格)
<meta> : 定义在head中 <hgroup></hgroup> : 标题分组标签 <br>: 换行标签 ! : 空行 <p>< ...
- @property@classmethod@staticmethod
一.静态属性@property将方法标记成数据属性:可以访问实例和类的属性 @classmethod标记成类的方法,不需要实例化,可以类直接调用的方法.可以访问类的属性方法,不能访问实例的 class ...
- firewalld 极速上手指南
从CentOS6迁移到7系列,变化有点多,其中防火墙就从iptables变成了默认Firewalld服务.firewalld网上资料很多,但没有说得太明白的.一番摸索后,总结了这篇文章,用于快速上手. ...
- h5css产品模块设计
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF ...
- 《RabbitMQ》如何保证消息不被重复消费
一 重复消息 为什么会出现消息重复?消息重复的原因有两个:1.生产时消息重复,2.消费时消息重复. 1.1 生产时消息重复 由于生产者发送消息给MQ,在MQ确认的时候出现了网络波动,生产者没有收到确认 ...