基础知识

  1. 码距:又叫海明距离,是在信息编码中,两个编码之间对应位上编码不同的位数。例如编码100110和010101,第1、2、5、6位都不相同,所以这两个编码的码距就是4,并且可以通过异或的方式求出(异或后计算零的个数)

  2. 奇偶校验(Parity Check):一种校验代码传输正确性的方法,分为奇校验和偶校验两种方式,目的都是在一字节(8位二进制数)后面加上一个校验位(0或1),奇校验下前面8位和校验码的1的个数应为奇数个,偶校验为偶数个。公式表示为:

    \[奇校验:G=\overline{C\oplus X_1\oplus X_2\oplus X_3\oplus ... \oplus X_n}\\
    偶校验:G=C\oplus X_1\oplus X_2\oplus X_3\oplus ... \oplus X_n\\
    G等于0表示数据正常,否则表示出错
    \]

    在实际中奇偶校验的选择是事先选择的。

    奇偶校验的特点

    1. 编码检错简单
    2. 编码效率高
    3. 不能检测偶数位错误,无错结论不可靠,是一种错误检测码
    4. 也没法识别错误,更不能纠正错误,出错只能重新传

汉明码/海明校验码

海明码的构成方法是在数据位之间的确定位置上插入k个校验位,通过扩大码距来实现检错和纠错。

汉明码跟其它的错误校验码类似,也利用了奇偶校验位的概念。不过与奇偶校验码不同的是,它并不是指定长度字节后面加一位,而是通过计算关系:

\[2^k-1\ge n+k(在指定n的情况下,找到满足式子的最小的k)
\]

计算出指定数据位对应的校验位长度。其中n为数据位,k为校验位长度。

计算

设数据位是8位,那么通过式子\(2^4-1=15>8+4=12\),则校验位为4位

设信息位为:D7,D6,D5,D4,D3,D2,D1,D0,校验位P3,P2,P1,P0,先计算校验位在总共12位的海明码中占据的位数:

  • \(P0=2^0=1\)
  • \(P1=2^1=2\)
  • \(P2=2^2=4\)
  • \(P3=2^3=8\)

所以校验位P3,P2,P1,P0分别占据第8、4、2、1位,而信息码从左到右占据剩下的位数,如表:

位数 12 11 10 9 8 7 6 5 4 3 2 1
信息位 D7 D6 D5 D4 D3 D2 D1 D0
校验位 P3 P2 P1 P0

注:这个表很多资料中其实是左右倒过来的,如果是倒过来的话就不用最后在倒置了

而信息位与校验位的关系为:信息位的位数=位数相加等于信息位位数的校验位组。例如D7的位数为12,所以D7的校验位组为P3和P2。

信息位 信息位检验计算 校验位组
D7 12=8+4 P3,P2
D6 11=8+2+1 P3,P1,P0
D5 10=8+2 P3,P1
D4 9=8+1 P3,P0
D3 7=4+2+1 P2,P1,P0
D2 6=4+2 P2,P1
D1 5=4+1 P2,P0
D0 3=2+1 P1,P0

所以,P0参与了D0,D1,D3,D4,D6的检验,其他由此类推:

\(P0=D0\oplus D1\oplus D3\oplus D4\oplus D6\)

\(P1=D0\oplus D2\oplus D3\oplus D5\oplus D6\)

\(P2=D1\oplus D2\oplus D3\oplus D7\)

\(P3=D4\oplus D5\oplus D6\oplus D7\)

注意:海明码是由高位到低位进行排序(高位先放,低位后方),所以得到的海明码是:P0 P1 D0 P2 D1 D2 D3 P3 D4 D5 D6 D7

而校验的方式则是算出信息的校验码,然后与得到的校验码对应,相同标0,不同标1(让01串异或成原来的样子),得到错误的位置为\(P3^*P2^*P1^*P0^*\)(\(Pn^*\)是标记)

python代码实现校验(这代码摸了快三天,代码水平还是得提高)

# -*- coding: utf-8 -*-
"""
Created on Fri Dec 3 21:59:38 2021
海明码解码纠错(默认只有一个错误)
@author: 01am
"""
#返回将列表里面的元素全部异或的值
def xor1(lista):
j=lista[0]
for i in range(1,len(lista)):
j=j^lista[i]
return j a = input("请输入海明码:")
len_a = len(a)
k=0 #确定k的值
for i in range(1,len_a):
tmp = pow(2,i)
if tmp > len_a :
k=i
break #循环创建校验位变量和校验位对应的数据位列表
for i in range(k):
exec('P'+str(i)+'='+str(a[pow(2,i)-1]))
exec('D'+str(i)+'=[]') #循环创建数据位变量并确定是否与校验位有关
for i in range(len_a):
#如果按照位数的二进制情况下查找1只有1个的情况下,那么一定是校验位
if bin(i+1).count('1')==1:#加一是为了解决range从0开始而海明码从1开始的矛盾
continue
else:
tmp1=bin(i+1)[-1:1:-1]#将二进制数翻转并且去掉0b,方便后面循环寻找相关的校验位
for j in range(len(tmp1)):
if tmp1[j]=='1' :#这里无需加一,因为校验位是从0开始的
exec('D'+str(j)+'.append('+str(a[i])+')') #新计算的纠错位和原校验位对比后的标志不准确
#判断校验位和计算出来的校验位是否一致
K=''
for i in range(k):
exec('tmp2 = D'+str(i)) #这里的问题,不能写成tmp2 = exec('D'+str(i)),这样会让tmp2成为NoneType
exec('tmp3 = P'+str(i))
tmp4 = xor1(tmp2) #这里可能会提示有变量未定义,不用理
if tmp4 == tmp3 : #这里可能会提示有变量未定义,不用理
K+='0'
else:
K+='1'
tmp5 = K[::-1]#校验位的位置,如果全为零就不存在 #判断校验码是否存在,存在就把对应的位置修改
a=list(a)
if tmp5.find('1')!=-1:
int1 = int(tmp5,2)-1
a[int1]=str(int(a[int1])^1)
print("已经自动纠错一位\n") #输出不带校验码的字符串
b=''
c=[pow(2,i) for i in range(k)]
for i in range(len_a):
if i+1 not in c:
b+=a[i]
a=''.join(a)
print(a)
print(b)

参考:

  1. 海明码的计算步骤
  2. 百度百科-奇偶校验
  3. 百度百科-海明校验码

汉明码、海明校验码(Hamming Code)的更多相关文章

  1. 常用校验码(奇偶校验码、海明校验码、CRC校验码)

    一.奇偶校验码 二.海明校验码 三.CRC校验码   计算机系统运行时,各个部之间要进行数据交换.交换的过程中,会有发生误码的可能(即0变成1或1变成0),由于计算机的储存是通过二进制代码来实现的的, ...

  2. 校验码(海明校验,CRC冗余校验,奇偶校验)

    循环冗余校验码 CRC码利用生成多项式为k个数据位产生r个校验位进行编码,其编码长度为n=k+r所以又称 (n,k)码. CRC码广泛应用于数据通信领域和磁介质存储系统中. CRC理论非常复杂,一般书 ...

  3. 常用校验码(奇偶校验,海明校验,CRC)学习总结

    常用校验码(奇偶校验,海明校验,CRC)学习总结 一.为什么要有校验码? 因为在数据存取和传送的过程中,由于元器件或者噪音的干扰等原因会出现错误,这个时候我们就需要采取相应的措施,发现并纠正错误,对于 ...

  4. 汉明码(Hamming Code)原理及实现

    汉明码实现原理 汉明码(Hamming Code)是广泛用于内存和磁盘纠错的编码.汉明码不仅可以用来检测转移数据时发生的错误,还可以用来修正错误.(要注意的是,汉明码只能发现和修正一位错误,对于两位或 ...

  5. Hamming校验码

    可参考:http://winda.blog.51cto.com/55153/1068000 Hamming校验码作用:用于校验通信数据,防止出现错误,并具有一定的纠错功能. 汉明码在传输的消息流中插入 ...

  6. 汉明码(hamming code)

    hamming code用于磁盘RAID 2中, 关于汉明码的讲解可以看这篇博文,介绍的很详细.最重要是最后的结论: 汉明码属于分组奇偶校验,P4P2P1=000,说明接收方生成的校验位和收到的校验位 ...

  7. 海明码 CRC冗余校验码

    海明码(也叫汉明码)具有一位纠错能力.本文以1010110这个二进制数为例解释海明码的编码和校验方法 确定校验码的位数x 设数据有n位,校验码有x位.则校验码一共有2x种取值方式.其中需要一种取值方式 ...

  8. Atitit 常用二维码对比(QR、PDF417、DM、汉信码 Aztec code maxicode

    Atitit 常用二维码对比(QR.PDF417.DM.汉信码 Aztec code maxicode DM码则更"小",可在仅仅25mm²的面积上编码30个数字.但也就是因为太小 ...

  9. PHP CRC16 校验码的算法怎么使用

    PHP CRC16 校验码的算法如何使用最近用到CRC16, 我现在就是要把 010301180001 算出CRC16的校验码,通过其他工具,可以得到 校验码是 05F1 最后完整的代码就是 0103 ...

随机推荐

  1. HBase文档学习顺序

    1.<HBase基础概念知识学习> https://www.toutiao.com/i6774215329498268164/ 2.<VM安装CentOS6.5> https: ...

  2. 【基因组学】maker的安装和注释

    本文默认读者有一定的生信基础,没有基础的可以阅读以前的笔记内容. maker作为比较受人认可的基因组注释软件,其流程较为清晰简单. 不知何故,我的conda无法安装maker,故而采用手动安装方式. ...

  3. HDU 1863 畅通工程 (并查集)

    原题链接:畅通工程 题目分析:典型的并查集模版题,这里就不详细叙述了.对算法本身不太了解的可以参考这篇文章:并查集算法详解 代码如下: #include <iostream> #inclu ...

  4. 浅谈xss漏洞

    0x00 xss漏洞简介 XSS漏洞是Web应用程序中最常见的漏洞之一.如果您的站点没有预防XSS漏洞的固定方法, 那么很可能就存在XSS漏洞. 跨站脚本攻击是指恶意攻击者往Web页面里插入恶意Scr ...

  5. 《剑指offer》面试题09. 用两个栈实现队列

    问题描述 用两个栈实现一个队列.队列的声明如下,请实现它的两个函数 appendTail 和 deleteHead ,分别完成在队列尾部插入整数和在队列头部删除整数的功能.(若队列中没有元素,dele ...

  6. rocketmq实现延迟队列(精确到秒级)

    最近项目里需要在延时队列,但是开源版本rocketmq不支持任意时间延时,造成有些任务无法执行 参考了网上的不少文章,但是都么有实现,所以再开源的基础上改造了个支持任意时间延时的队列. 源码地址: h ...

  7. 前端——JSON学习总结

    学习网址: https://www.bilibili.com/video/BV1Pt411u7R3 什么是JSON?(以下有关概念内容为视频中学习文档相关内容,代码为本人学习时使用的有关代码) JSO ...

  8. 《手把手教你》系列技巧篇(五十九)-java+ selenium自动化测试 - 截图三剑客 -上篇(详细教程)

    1.简介 今天本来是要介绍远程测试的相关内容的,但是宏哥在操作服务器的时候干了件糊涂的事,事情经过是这样的:本来申请好的Windows服务器用来做演示的,可是服务器可能是局域网的,连百度都不能访问,宏 ...

  9. 【笔记】对golang的大量小对象的管理真的是无语了……

    业务中有这样一个struct: type bizData struct{ A uint64 B uint64 C int32 D uint32 } 虽然没有实测,但我猜测这样的对齐方式,这个struc ...

  10. 初识WorldWind——WorldWind编译生成,解决乱码等问题

    本文中World Wind的GitHub源码下载地址:https://github.com/hujiulin/WorldWind 美国国家航空航天局(National Aeronautics and ...