C语言原子接口与实现

　　原子是一个指向唯一的、不可变的0个或任意多个字节序列的指针，大多数原子都是指向以空字符结束的字符串，但是任何一个指向任意字节序列的指针都可以使原子。任何原子只能出现一次。如果两个原子指向同一个内存单元时，则两个原子是相等的。仅仅比较两个字节序列相应的指针是否相等，就可以判断这两个字节序列是否相等了，这就是使用原子的好处之一；还有一个好处就是使用原子可以节省空间，因为每个序列只会出现一次。

本文地址：http://www.cnblogs.com/archimedes/p/c-atom.html，转载请注明源地址。

接口

Atom的接口很简单：

#ifndef ATOM_INCLUDED

#define ATOM_INCLUDED

extern       int   Atom_length(const char *str);

extern const char *Atom_new   (const char *str, int len);

extern const char *Atom_string(const char *str);

extern const char *Atom_int   (long n);

#endif

atom.h

Atom_new接收一个指向字节序列的指针以及该序列的字节数作为输入，它在原子表中增加一个该序列的拷贝，并且如果需要的话，返回原子表中指向该拷贝的指针（即原子）

原子总是以一个空字符结束，在必要的时候该空字符由Atom_new添加

Atom_string接收一个空字符串结束的字符串作为输入，在原子表中增加一个该串的拷贝，如果需要的话返回该原子

Atom_int返回长整数n的字符串表示的原子

Atom_length返回其原子参数的长度

实现

Atom的实现对原子表进行维护。Atom_new,Atom_string,Atom_int查找原子表，并都有可能在原子表中添加一个新的元素，而Atom_length仅仅查找原子表

#include "atom.h"

Atom_string,Atom_int可以在不知道原子表细节的情况下执行相应的操作

#include <string.h>

#include "assert.h"

const char *Atom_string(const char *str) {

    assert(str);

    return Atom_new(str, strlen(str));

}

Atom_int首先把它的参数转化为一个字符串，然后调用Atom_new:

#include <limits.h>

const char *Atom_int(long n) {  /*将参数转换成一个字符串，然后调用Atom_new*/

    char str[];

    char *s = str + sizeof str;  /*将s指向字符数组的尾部*/

    unsigned long m;

    if (n == LONG_MIN)    /*处理最小的负长整数*/

        m = LONG_MAX + 1UL;

    else if (n < )

        m = -n;

    else

        m = n;

    do

        *--s = m% + '';   /*对m取余获取最后一位数字倒序保存在字符数组中*/

    while ((m /= ) > );

    if (n < )

        *--s = '-';  /*如果n是负数在结果前面加上’-‘号*/

    return Atom_new(s, (str + sizeof str) - s);

}

Atom_int必须处理二进制补码数的不对称范围以及C的除法和取余运算的不确定性，无符号的除法和取余都具有良好的定义，因此Atom_int也可以通过使用无符号算术来避免使用有符号运算引起的不确定。

引入头文件和相关宏：

#include "atom.h"

#include <string.h>

#include "assert.h"

#include <limits.h>

#include "mem.h"   /* 内存管理接口 */

#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))

 /* 求数组中元素的个数 */

散列表显然是一个针对原子表的数据结构，散列表是一个入口表的指针数组，其中每一个元素都存有一个原子：

static struct atom {

    struct atom *link;  /*指向表中的下一个入口*/

    int len;  /*len存储序列的长度*/

    char *str;   /*str指向序列本身*/

} *buckets[];  /*散列表的长度小于2048*/

针对“an atom”的struct atom的小尾数法布局：

Atom_new计算由str[0……len-1]给定序列的散列值，并用buckets的元素个数对其取模，搜索由buckets中该散列值元素所指向的链表。如果发现str[0……len-1]已存在于表中，它将只是简单地返回该原子：

#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))  /* 求数组中元素的个数 */

const char *Atom_new(const char *str, int len) {  /*接收一个指向字节序列的指针以及该序列的字节数，在原子表中增加一个该序列的拷贝*/

    unsigned long h;

    int i;

    struct atom *p;

    assert(str);

    assert(len >= );

    for (h = , i = ; i < len; i++)  /*查找表算法*/

        h = (h<<) + scatter[(unsigned char)str[i]];

    h &= NELEMS(buckets)-;

    for (p = buckets[h]; p; p = p->link)  /*在buckets[h]中查找是否存在str*/

        if (len == p->len) {

            for (i = ; i < len && p->str[i] == str[i]; )

                i++;

            if (i == len)

                return p->str;  /*找到即返回*/

        }

    p = ALLOC(sizeof (*p) + len + );  /*没找到则新建原子*/

    p->len = len;

    p->str = (char *)(p + );

    if (len > )

        memcpy(p->str, str, len);

    p->str[len] = '\0';

    p->link = buckets[h];

    buckets[h] = p;

    return p->str;

}

Hash表结构：

Atom的实现对原子表进行维护，Atom_new、Atom_string以及Atom_int查找原子表，并且都有可能在原子表中添加一个新的元素，而Atom_length仅仅查找原子表。

完整实现代码如下：

#include "atom.h"

#include <string.h>

#include "assert.h"

#include <limits.h>

#include "mem.h"   /* 内存管理接口 */

#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[0])))  /* 求数组中元素的个数 */

static struct atom {

    struct atom *link;  /*指向表中的下一个入口*/

    int len;  /*len存储序列的长度*/

    char *str;   /*str指向序列本身*/

} *buckets[];  /*散列表的长度小于2048*/

static unsigned long scatter[] = {  /*256入口数组，它将字节映射为随机数，这些随机数通过标准库的rand函数生成*/

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , , , , ,

, , ,

};

const char *Atom_string(const char *str) {

    assert(str);

    return Atom_new(str, strlen(str));

}

const char *Atom_int(long n) {  /*将参数转换成一个字符串，然后调用Atom_new*/

    char str[];

    char *s = str + sizeof str;  /*将s指向字符数组的尾部*/

    unsigned long m;

    if (n == LONG_MIN)    /*处理最小的负长整数*/

        m = LONG_MAX + 1UL;

    else if (n < )

        m = -n;

    else

        m = n;

    do

        *--s = m% + '';   /*对m取余获取最后一位数字倒序保存在字符数组中*/

    while ((m /= ) > );

    if (n < )

        *--s = '-';  /*如果n是负数在结果前面加上’-‘号*/

    return Atom_new(s, (str + sizeof str) - s);

}

const char *Atom_new(const char *str, int len) {  /*接收一个指向字节序列的指针以及该序列的字节数，在原子表中增加一个该序列的拷贝*/

    unsigned long h;

    int i;

    struct atom *p;

    assert(str);

    assert(len >= );

    for (h = , i = ; i < len; i++)  /*查找表算法*/

        h = (h<<) + scatter[(unsigned char)str[i]];

    h &= NELEMS(buckets)-;

    for (p = buckets[h]; p; p = p->link)  /*在buckets[h]中查找是否存在str*/

        if (len == p->len) {

            for (i = ; i < len && p->str[i] == str[i]; )

                i++;

            if (i == len)

                return p->str;  /*找到即返回*/

        }

    p = ALLOC(sizeof (*p) + len + );  /*没找到则新建原子*/

    p->len = len;

    p->str = (char *)(p + );

    if (len > )

        memcpy(p->str, str, len);

    p->str[len] = '\0';

    p->link = buckets[h];

    buckets[h] = p;

    return p->str;

}

int Atom_length(const char *str) {

    struct atom *p;

    int i;

    assert(str);

    for (i = ; i < NELEMS(buckets); i++)

        for (p = buckets[i]; p; p = p->link)  /*在buckets表中查找str*/

            if (p->str == str)

                return p->len;  /*成功找到后返回len*/

    assert();

    return ;

}

atom.c

参考资料

《C语言接口与实现--创建可重用软件的技术》

C语言原子接口与实现的更多相关文章

R语言数据接口
R语言数据接口 R语言处理的数据一般从外部导入,因此需要数据接口来读取各种格式化的数据 CSV # 获得data是一个数据帧 data = read.csv("input.csv" ...
[日常] Go语言圣经--接口约定习题
Go语言圣经-接口1.接口类型是对其它类型行为的抽象和概括2.Go语言中接口类型的独特之处在于它是满足隐式实现的3.Go语言中还存在着另外一种类型:接口类型.接口类型是一种抽象的类型4.一个类型可以自 ...
FFI （语言交互接口(Foreign Function Interface)）
FFI(Foreign Function Interface)是用来与其它语言交互的接口, 在有些语言里面称为语言绑定(language bindings), Java 里面一般称为 JNI(Java ...
c语言调试接口
http://blog.chinaunix.net/uid-10106787-id-2985587.html 在C语言程序设计中,常会出现各种各样的bug:段错误.参数异常等等.我们需要尽快定位错误, ...
Java语言Socket接口用法详解
Socket接口用法详解在Java中,基于TCP协议实现网络通信的类有两个,在客户端的Socket类和在服务器端的ServerSocket类,ServerSocket类的功能是建立一个Serve ...
C语言/原子/编译，你真的明白了吗？
说到原子,类似于以下的代码可能人人都可以看出猫腻. #include <stdio.h> #include <pthread.h> ; void* mythread(void* ...
Go语言的接口
一.接口的定义和好处我们都知道接口给类提供了一种多态的机制,什么是多态,多态就是系统根据类型的具体实现完成不同的行为. 以下代码简单说明了接口的作用 package main import ( &q ...
go语言学习-接口
Go语言中虽然没有传统面向对象语言中类.集成的概念,不过提供了接口的支持,可以使用接口来使用一些面向对象的特性. 在 go 语言中,的接口有下面几个特点: 可以包含0个或多个方法的签名只定义方法的签 ...
Go语言的接口interface、struct和组合、继承
Go语言的interface概念相对于C++中的基类,通过interface来实现多态功能. 在C++中,当需要实现多态功能时,步骤是首先定义一个基类,该基类使用虚函数或者纯虚函数抽象了所有子类会用到 ...

随机推荐

【软件分析与挖掘】Multiple kernel ensemble learning for software defect prediction
摘要: 利用软件中的历史缺陷数据来建立分类器,进行软件缺陷的检测. 多核学习(Multiple kernel learning):把历史缺陷数据映射到高维特征空间,使得数据能够更好地表达: 集成学习( ...
eclipse 手动/自动安装插件
只要你的Eclipse的压缩包,一般为xxx.zip,其内部包含了对应的features和plugins文件夹,(不管是否还有content.jar和artifacts.jar)则都可以: 要么手动解 ...
HTML5[7]: 实现网页版的加载更多
理所当然,jQuery出场: $(function() { $(window).scroll(function() { if($(this).scrollTop() + $(this).innerHe ...
epoll源码实现分析[整理]
epoll用法回顾先简单回顾下如何使用C库封装的3个epoll相关的系统调用.更详细的用法参见http://www.cnblogs.com/apprentice89/archive/2013/05/ ...
你或许不了解的C++函数调用(1)
这篇博客名字起得可能太自大了,搞得自己像C++大牛一样,其实并非如此.C++有很多隐藏在语法之下的特性,使得用户可以在不是特别了解的情况下简单使用,这是非常好的一件事情.但是有时我们可能会突然间发现一 ...
R Language
向量定义:x1 = c(1,2,3); x2 = c(1:100) 类型显示:mode(x1) 向量长度:length(x2) 向量元素显示:x1[c(1,2,3)] 多维向量:multi-dimen ...
让 ASP.NET JS验证和服务端的双验证更简单
只用JavaScript验证安全不安全谁都知道,答案是不安全,非常的不安全.因为在客户端进行的验证相当于“让用户自己验证自己”,很明显是不靠谱的.你不能避免一些恶意用户人为的修改自己的表单进行欺骗,也 ...
用Javascript实现回到顶部效果
用Javascript实现回到顶部效果经常看到网页中有回到顶部的效果,今天也研究一下回到顶部有哪些方法.众所周知,用锚链接是实现回到最简单的方法,但是从用户体验效果来说,并不是最好的.(锚链接回到顶 ...
二元查找树转变成排序的双向链表之C#算法实现
此题为July在CSDN发布的微软编程面试100题中的第一题,觉得蛮有趣的,今天也拿过来玩玩,July的代码用的是C++实现,可能因为有指针的原因吧,感觉看起来相对比较容易理解整个的实现过程,而我,试 ...
1117 新冲刺 day1
项目需求确定现阶段我们进行的项目是到店点餐系统.主要是开发手机端app为用户提供方便快捷的点餐服务.免去顾客到店后遇到因吃饭的人太多而找不到服务人员点餐的窘境.减少了服务人员因为忙碌而导致下单慢的问 ...

C语言原子接口与实现

接口

实现

参考资料

C语言原子接口与实现的更多相关文章

随机推荐

热门专题