一文讲透 FPGA CDC 多bit跨时钟域同步-hand-shanking机制

一、背景

数据的跨时钟域处理是FPGA开发过程中的常见问题，存在两种情况

1. 慢时钟向快时钟同步：只需在快时钟域打两拍即可。其RTL如下：
打拍同步的原理：大家在初学FPGA时，经常听过FPGA中对信号打拍可以有效得避免亚稳态，而且一般要打两拍，其数学本质是如果打一拍发生错误得概率是1/1000，那么打两拍发生错误得概率就是1/1000000，这从统计意义上已经无限接近0。

从电路本身的角度上讲，如果一个信号的更新频率与当前时钟域内的信号更新频率不同步,那么其和当前时钟域内的信号做任何运算,都有可能导致结果出现毛刺或者不满足下级寄存器的建立或保持时间。因此,为了确保新引人的这个非本时钟域的信号不会对本时钟域造成毁灭性打击,必须对其进行同步化处理,而方法就是使用当前时钟地域的时钟对其进行采样。而进行两次打拍是让异步信号打两拍可以让异步过来的电平信号达到一个比较“健壮”的电平区间，二避免了由于建立时间、多级扇出导致的逻辑电平不稳定的情况。以下摘自《FPGA之道》：

“为什么要采样两次呢?

采样一次,已经完成了非本时钟域信号的同步操作,那么为什么还要采用两级采样法呢?虽然从逻辑上来看,两级采样法就跟移位寄存器一样,并不能改变信号的逻辑值,而且还会增加信号传递进来的延迟,但是这绝对不是画蛇添足,而是非常必要的,原因如下:请大家思考一下,进行第一级采样的那个寄存器,其建立和保持时间是不否能够得到满足?显然在有些情况下,其建立和保持时间是无法得到满足的,因为它和当前时钟域时钟信号的变化并不同步,因此总会碰到问题。例如,当asynsignal从0变化到1时,如果在过这前后时间内,clk共经历了3个上升沿,那么unsafesignal的输出可能是001,也可能是011,其中,第二次采样由于建立或者保持时间不满足,所以无法确定其是0还是1,不过值得欧慰的是,无论是001,还是011,都至少正确捕捉到了原始信号的变化。也许你会觉得,异步逻辑本身就不可能在时间上被精确地捕捉到,既然能够正确捕捉到信号的变化,那不就够了么?没错,从逻辑上来说是够了,但是从驱动能力上来说,也许不够。大家都知道,FPGA内部的工作电压一般为1.5V,也就是说,理想情况下,逻辑1对应电压1.5V,逻辑0对应电压0V。但是现实是残酷的,逻辑1不可能精确地是1.5V,逻辑0也不可能是精确地0V,事实上,也许业界公认0.5V以上就可以判定为逻辑1,反之则可以被判定为逻辑0,这也是为什么数字信信号比模拟信号更能抗干扰的原因。所以,如果现在问你,FPGA内部有两个触发器的输出都是逻辑1,那么它俩的物理电压相等吗?答案显然是不一定。为什么触发器能够给出正确地输出结果的前提是输入信号要满足其建立、保持时间要求?其实原因很简单,就是要给数字电路以充足的时间来进行充电或者放电操作,从而让其输出的逻辑1更接近于1.5V,逻辑0更接近于0V;反之,如果一个逻辑电平1、0对应的物理电平更接近于1.5V或者0V,那么它就更容易在规定时间内对其后级触发器进行充分的充电或放电控制,从而使其后级触发器的输出也更加"强壮"。那么现在,我们在回过头来审视unsafesignal的物理电压,由于输出unsafesignalf的触发器,很可能出现建立或保持时间要求不满足的情况,因此,在这种情况下,它的充、放电操作都很不充分,输出的逻辑1或者逻辑0的物理电压都不会太好。例如,如果unsafesignalj为逻辑1,那么其物理电压很可能为0.6V,如果当前时钟域中有很多地方都用到了unsafesignal,那么0.6V电压的扇出能力显然会比较差,因此等传递到后续各个用到unsafe signal的地方,物理电压可能就变为0.4V、0.5V、0.55V等等,那么这时 unsafe signal就会被不同的触发器认成不同的逻辑电平,于是错误便诞生了。为了避免这种情况的发生,我们对unsafesignal再次进行采样。由于unsafesignal和safesignal是同步的,因此对于输出safesignal的触发器来说,建立时间已经远远超出了其建立时间要求,因此,即使0.6V的电压对其充电比较慢,但由于充电时间足够,充电电流也有保障,所以也能让safesignal达到一个比较健壮的物理电压,例如1.4V。接下来,我们再将safesignal连接到各个需要使用它的地方,其扇出能力就不会再有任何问题了。”

2.快时钟域向慢时钟域同步

第一种简单的方式是在快慢时钟域间添加一个FIFO，这样就可以避免时钟不同步的问题。

第二种方式是hand shanking机制，简单来说就是一种握手机制，其时序图可以用下图表示：

在数据有效后，主机发起同步请求req,直至检测到从机的ACK信号后，req拉低，标志一次同步结束。而req信号在从机进行采样同步，并经过两拍后，从机对主机的DATA信号进行采样同步，完成从快时钟域到慢时钟域的数据同步。

代码如下：

  `// ************************ ***************************************

// Copyright (C) xx Coporation

// File name: hand_shanking.v

// Author: Dongyang

// Date: 2024-11/16

// Version: 1.0

// Abstract: CDC multi bit sync,use hand shanking to sync data

//***************************************************************** `

`timescale 1 ns/1 ns

module  hand_shanking_module# (

    parameter integer DATA_WIDTH = 8

    )

(

    input                            i_clk_f          ,     //

    input                            i_sys_rst_n      ,     //外部异步复位信号

    input       [DATA_WIDTH-1 : 0]   i_src_data       ,     //外部输入信号,

    input                            i_src_data_valid ,     //数据有效标志

    input                            i_clk_s          ,

    output                           o_des_ack        ,     //应答完成信号，取上升沿后可作为i_clk_s 的o_des_data 的valid 信号

    output  reg [DATA_WIDTH-1 : 0]   o_des_data            //在i_clk_s 时钟域同步后的信号

);

//******************** siganl define  ***********************

    reg                         r_src_req             ;

    reg                         r_src_ack_sync1       ;

    reg                         r_src_ack_sync2       ;

    reg                         r_des_req_sync1       ;

    reg                         r_des_req_sync2       ;

    reg                         r_des_ack             ; 

//************** combination  logic *************************

assign        o_des_ack = r_des_ack;

// step 1 , generate r_src_req

always @(posedge i_clk_f or negedge i_sys_rst_n) begin

    if (~i_sys_rst_n) begin

        r_src_req <= 1'b0;

    end

    else begin

        if (i_src_data_valid) begin                  //once datavalid , generate r_src_req

            r_src_req <= 1'b1;

        end

        else if (r_src_ack_sync2) begin             // when i_clk_s domain ack successfully,r_src_req reset

            r_src_req <= 1'b0;

        end

    end

end

//step 2 and 3, under i_clk_s domain, sync r_src_req from i_clk_f domain,generate ack ok siganl

always @(posedge i_clk_s or negedge i_sys_rst_n) begin

    if (~i_sys_rst_n) begin

        r_des_req_sync1 <= 1'b0;

        r_des_req_sync2 <= 1'b0;

        r_des_ack       <= 1'b0;

    end

    else begin

        r_des_req_sync1 <= r_src_req ;

        r_des_req_sync2 <= r_des_req_sync1;

        r_des_ack       <= r_des_req_sync2;

    end

end

//step 3, once r_des_req_sync2 set, sync o_des_data

always @(posedge i_clk_s or negedge i_sys_rst_n) begin

     if (~i_sys_rst_n) begin

        o_des_data <= 'b0;

     end

     else begin

        if(r_des_req_sync2) begin

            o_des_data <= i_src_data;

        end

     end

end

//step 4 ,sync r_des_ack to i_clk_f domain

always@(posedge i_clk_f or negedge i_sys_rst_n) begin

    if(~i_sys_rst_n) begin

        r_src_ack_sync1 <= 1'b0;

        r_src_ack_sync2 <= 1'b0;

    end

    else begin

        r_src_ack_sync1 <= r_des_ack;

        r_src_ack_sync2 <= r_src_ack_sync1;

    end

end

endmodule

TestBench:

`timescale 1 ns/1 ns

module tb_hand_shanking();

parameter integer DATA_WIDTH =  8;

reg                         clk_f      = 'b0;

reg                         clk_s      = 'b0;

reg                         sys_rst_n  = 'b0;

reg   [DATA_WIDTH- 1 : 0 ]  src_data   = 'b0;

reg                         data_valid = 'b0;

always # 10   clk_f = ~ clk_f;

always # 30   clk_s = ~ clk_s;

initial begin

    clk_f      = 'b0;

    clk_s      = 'b0;

    sys_rst_n  = 'b0;

    src_data   = 'b0;

    data_valid = 'b0;

    #50

    sys_rst_n <= 1'b1;

    #100

    src_data <= 8'h5A;

    data_valid <= 1'b1;

    #20

    data_valid <= 1'b0;

    #500

    src_data <= 8'h6A;

    data_valid <= 1'b1;

    #20

    data_valid <= 1'b0;

end

hand_shanking_module

#(

        .DATA_WIDTH(DATA_WIDTH)

)

 U_hand_shanking_module_0

(

    .i_clk_f             (clk_f),

    .i_sys_rst_n         (sys_rst_n),

    .i_src_data          (src_data),

    .i_src_data_valid    (data_valid),

    .i_clk_s             (clk_s),

    .o_des_ack           (),

    .o_des_data          ()

);

endmodule

仿真波形：

https://img2024.cnblogs.com/blog/3539410/202411/3539410-20241116161229825-134001601.png

一文讲透 FPGA CDC 多bit跨时钟域同步-hand-shanking机制的更多相关文章

FPGA基础学习(3) -- 跨时钟域处理方法
文章主要是基于学习后的总结. 1. 时钟域假如设计中所有的触发器都使用一个全局网络,比如FPGA的主时钟输入,那么我们说这个设计只有一个时钟域.假如设计有两个输入时钟,如图1所示,一个时钟给接口1使 ...
FPGA跨时钟域处理方法
文章主要是基于学习后的总结. 1. 时钟域假如设计中所有的触发器都使用一个全局网络,比如FPGA的主时钟输入,那么我们说这个设计只有一个时钟域.假如设计有两个输入时钟,如图1所示,一个时钟给接口1使 ...
cdc跨时钟域处理-结绳握手法
参考文档 https://blog.csdn.net/u011412586/article/details/10009761 前言对于信号需要跨时钟域处理而言,最重要的就是确保数据能稳定的传送到采样 ...
基于FPGA的跨时钟域信号处理——专用握手信号
在逻辑设计领域,只涉及单个时钟域的设计并不多.尤其对于一些复杂的应用,FPGA往往需要和多个时钟域的信号进行通信.异步时钟域所涉及的两个时钟之间可能存在相位差,也可能没有任何频率关系,即通常所说的不同 ...
FPGA跨时钟域握手信号的结构
FPGA跨时钟数据传输,是我们经常遇到的问题的,下面给出一种跨时钟握手操作的电路结构.先上图先对与其他人的结构,这个结构最大的特点是使用 req 从低到高或者高到低的变化来表示DIN数据有效并开始 ...
一文讲透Dubbo负载均衡之最小活跃数算法
本文是对于Dubbo负载均衡策略之一的最小活跃数算法的详细分析.文中所示源码,没有特别标注的地方均为2.6.0版本. 为什么没有用截止目前的最新的版本号2.7.4.1呢?因为2.6.0这个版本里面有两 ...
从零入门 Serverless | 一文讲透 Serverless Kubernetes 容器服务
作者 | 张维(贤维) 阿里云函数计算开发工程师导读:Serverless Kubernetes 是以容器和 kubernetes 为基础的 Serverless 服务,它提供了一种简单易用.极致弹 ...
一文讲透产品经理如何用好ChatGPT
作者:京东零售何雨航 "4.0版本的ChatGPT可以有效提升产品经理工作效率,但并无法替代产品经理的角色." 一.引言 3月15日,OpenAI发布了最新的基于GPT-4的Ch ...
一文讲透静电放电（ESD）保护（转发）
一直想给大家讲讲ESD的理论,很经典.但是由于理论性太强,任何理论都是一环套一环的,如果你不会画鸡蛋,注定了你就不会画大卫. 先来谈静电放电(ESD: Electrostatic Discharge) ...
一文讲透Cluster API的前世、今生与未来
作者:Luke Addison 原文链接:https://blog.jetstack.io/blog/cluster-api-past-present-and-future/ Cluster API是 ...

随机推荐

仿MFC的消息印射(全局函数的实现)
//弄了个仿MFC消息映射,这是全局函数都好弄,照着MFC就弄出来了,//在vs2017上可以通过#include <windows.h> #include "resource. ...
Go context 介绍
在 Go 编程语言中,context 包提供了一个用于在 goroutine 之间传递上下文信息的方法.它通常用于控制 goroutine 的生命周期.传递请求范围内的数据.以及处理超时或取消信号.c ...
Kubernetes-18：Dashboard安装及使用
Helm安装Dashboard 简介 Dashboard 是 kubernetes 的图形化管理工具,可直观的看到k8s中各个类型控制器的当前运行情况,以及Pod的日志,另外也可直接在 dashboa ...
Docker高级：Redis集群实战！4主4从缩容到3主3从，怎么处理？
在上一篇,我们学会了redis集群的扩容.从3主3从扩容到4主4从. 那么,接着,活动过去了.流量没有那么大了.需要缩容了.从4主4从缩容到3主3从了.那么这个时候又该怎么处理呢? PS本系列:< ...
Angular 18+ 高级教程 – Component 组件の Angular Component vs Shadow DOM (CSS Isolation & slot)
前言要掌握 Angular,最好先掌握原生. 全局 CSS 的问题,还有如何用原生 CSS 来管理全局 CSS,看这篇. 利用 Shadow Dom 来隔离 CSS 看这篇. CSS Global ...
Listener——监听器
Listener
ArgoWorkflow教程(五)---Workflow 的多种触发模式：手动、定时任务与事件触发
上一篇我们分析了argo-workflow 中的 archive,包括流水线GC.流水线归档.日志归档等功能.本篇主要分析 Workflow 中的几种触发方式,包括手动触发.定时触发.Event 事 ...
SimpleAIAgent：使用免费的glm-4-flash即可开始构建简单的AI Agent应用
SimpleAIAgent是基于C# Semantic Kernel 与 WPF构建的一款AI Agent探索应用.主要用于使用国产大语言模型或开源大语言模型构建AI Agent应用的探索学习,希望能 ...
高强度学习训练第七天总结:JVM分配内存机制
理解JVM内存分配策略三大原则+担保机制 JVM分配内存机制有三大原则和担保机制具体如下所示: 优先分配到eden区大对象,直接进入到老年代长期存活的对象分配到老年代空间分配担保对象优先在 ...
iOS文本字数动态展示使用小结
项目开发中经常用到类似这样的功能,文本输入的时候需要动态的显示文本输入字数.这里以多行文本框为例,介绍一下实现方案.核心代码如下 -(void)textViewDidChange:(UITextVie ...

一文讲透 FPGA CDC 多bit跨时钟域同步-hand-shanking机制

一文讲透 FPGA CDC 多bit跨时钟域同步-hand-shanking机制的更多相关文章

随机推荐

热门专题