关于strlen

strlen的实现是通过4个字节4个字节进行枚举，然后通过位运算来判断这4个字节中是否有一个字节含有0，这样的话，效率就提高了4倍。

这个效率提高是假设a&b&c&d与a&b有差不多效率的前提下。

那用8字节8字节来偏移的话，是不是更快呢？32位机上不会，64位机上会提高一倍。因为a&b在64位下会提高一倍，因为32位的寄存器大小是32位的，对于分别MOV高位与低位两次。

本来实验a&b&c&d与a&b的速度的，经实验验证，这两个效率确实是差不多的，然后去看汇编，看指令条数，在没有使用-O优化下，指令的条数差别跟运算符号的个数的倍数相同，就让我感到疑惑了。

下面附上实验的代码：

#include <iostream>

#include <time.h>

#include <cstdio>

#include <string>

using namespace std;

int _strlen(const char *str) {

    const unsigned int *p = (const unsigned int *) str;

    unsigned int low = 0x01010101;

    unsigned int high = 0x80808080;

    while (true) {

        unsigned int d = *p++;

        if (((d - low) & ~d & high) != ) { // handle [0...256)

        //if (((d - low) & high) != 0) { // handle [0...128)

            break;

        }

    }

    const char *q = (const char *)(p - );

    for (int i = ; i < (int)sizeof(unsigned int); i++) {

        if (q[i] == ) {

            return q - str + i;

        }

    }

    return -;

}

int _strlen2(const char *str) {

    const char *p = str;

    while (*p != ) {

        p++;

    }

    return p - str;

}

int _strlen3(const char *str) {

    const unsigned long long *p = (const unsigned long long *) str;

    unsigned long long low = 0x0101010101010101;

    unsigned long long high = 0x8080808080808080;

    while (true) {

        unsigned long long d = *p++;

        if (((d - low) & ~d & high) != ) { // handle [0...256)

        //if (((d - low) & high) != 0) { // handle [0...128)

            break;

        }

    }

    const char *q = (const char *)(p - );

    for (int i = ; i < (int)sizeof(unsigned long long); i++) {

        if (q[i] == ) {

            return q - str + i;

        }

    }

    return -;

}

size_t _strlen4(const char *str)

{

  const char *char_ptr;

  const unsigned long int *longword_ptr;

  unsigned long int longword, himagic, lomagic;

  /* Handle the first few characters by reading one character at a time.

     Do this until CHAR_PTR is aligned on a longword boundary.  */

  for (char_ptr = str; ((unsigned long int) char_ptr

            & (sizeof (longword) - )) != ;

       ++char_ptr)

    if (*char_ptr == '\0')

      return char_ptr - str;

  /* All these elucidatory comments refer to 4-byte longwords,

     but the theory applies equally well to 8-byte longwords.  */

  longword_ptr = (unsigned long int *) char_ptr;

  /* Bits 31, 24, 16, and 8 of this number are zero.  Call these bits

     the "holes."  Note that there is a hole just to the left of

     each byte, with an extra at the end:

     bits:  01111110 11111110 11111110 11111111

     bytes: AAAAAAAA BBBBBBBB CCCCCCCC DDDDDDDD

     The 1-bits make sure that carries propagate to the next 0-bit.

     The 0-bits provide holes for carries to fall into.  */

  himagic = 0x80808080L;

  lomagic = 0x01010101L;

  if (sizeof (longword) > )

    {

      /* 64-bit version of the magic.  */

      /* Do the shift in two steps to avoid a warning if long has 32 bits.  */

      himagic = ((himagic << ) << ) | himagic;

      lomagic = ((lomagic << ) << ) | lomagic;

    }

    /*j

  if (sizeof (longword) > 8)

    abort ();

    */

  /* Instead of the traditional loop which tests each character,

     we will test a longword at a time.  The tricky part is testing

     if *any of the four* bytes in the longword in question are zero.  */

  for (;;)

    {

      longword = *longword_ptr++;

      if (((longword - lomagic) & ~longword & himagic) != )

    {

      /* Which of the bytes was the zero?  If none of them were, it was

         a misfire; continue the search.  */

      const char *cp = (const char *) (longword_ptr - );

      if (cp[] == )

        return cp - str;

      if (cp[] == )

        return cp - str + ;

      if (cp[] == )

        return cp - str + ;

      if (cp[] == )

        return cp - str + ;

      if (sizeof (longword) > )

        {

          if (cp[] == )

        return cp - str + ;

          if (cp[] == )

        return cp - str + ;

          if (cp[] == )

        return cp - str + ;

          if (cp[] == )

        return cp - str + ;

        }

    }

    }

}

string gen_data() {

    string a;

    for (int i = ; i < ; i++) {

        a.push_back('a');

    }

    return a;

}

double get_run_time(int(*fp)(const char *), const char *str, int count) {

    clock_t start = clock();

    for (int i = ; i < count; i++) {

        fp(str);

    }

    clock_t end = clock();

    return (double)(end - start) / CLOCKS_PER_SEC;

}

double get_run_time(size_t(*fp)(const char *), const char *str, int count) {

    clock_t start = clock();

    for (int i = ; i < count; i++) {

        fp(str);

    }

    clock_t end = clock();

    return (double)(end - start) / CLOCKS_PER_SEC;

}

int main() {

    string a = gen_data();

    printf("%d\n", _strlen(a.c_str()));

    printf("%d\n", _strlen2(a.c_str()));

    printf("%d\n", _strlen3(a.c_str()));

    printf("%d\n", (int)strlen(a.c_str()));

    double time = get_run_time(&_strlen, a.c_str(), );

    printf("%f\n", time);

    double time2 = get_run_time(&_strlen2, a.c_str(), );

    printf("%f\n", time2);

    double time3 = get_run_time(&_strlen3, a.c_str(), );

    printf("%f\n", time3);

    double time4 = get_run_time(&strlen, a.c_str(), );

    printf("%f\n", time4);

    double time5 = get_run_time(&_strlen4, a.c_str(), );

    printf("%f\n", time5);

}

关于strlen的更多相关文章

php的empty()，trim(),strlen()方法
如果empty()函数的参数是非空或非零的值,则empty()返回FALSE.换句话说,"".0."0".NULL.array().var$var:以及没有任何 ...
c/c++中关于sizeof、strlen的使用说明
sizeof: 一般指类型.变量等占用的内存大小(由于在编译时计算,因此sizeof不能用来返回动态分配的内存空间的大小) strlen: c字符串的长度(参数必须是字符型指针 char*,当数组名作 ...
[PHP源码阅读]strlen函数
文章来自:http://www.hoohack.me/2016/02/22/phps-source-analytics-strlen 我在github有对PHP源码更详细的注解.感兴趣的可以围观一下, ...
php每天一题：strlen()与mb_strlen()的作用分别是什么
strlen()与mb_strlen()都是用于获取字符串长度的,那么它们两个有什么不同? strlen()与mb_strlen()的不同之处在于mb_strlen()第二个参数可以用于指定字符编码. ...
sizeof与strlen的区别
1 sizeof是操作符,而strlen是库函数: 2 sizeof的参数可以为任意变量或类型,而strlen必须以char*做参数,且字符串必须以‘/0’结尾: 3 数组名用作sizeof参数时不会 ...
strlen()和sizeof()求数组长度
在字符常量和字符串常量的博文里有提: 求字符串数组的长度标准库函数strlen(s)可以返回字符串s的长度,在头文件<string.h>里. strlen(s)的判断长度的依据是(s[i ...
Linux C 字符串函数 strlen()、strcat()、strncat()、strcmp()、strncmp()、strcpy()、strncpy() 详解
strlen(返回字符串长度) 表头文件 #include <string.h> 定义函数 size_t strlen(const char *s); 函数说明 strlen()用来计 ...
回文字符串的判断！关于strlen(char * str)函数
#include <stdio.h> #include <string.h> int ishuiw(char * p); int main() { ;//true-false接 ...
关于strlen误用的一点记录
今天帮一个朋友查一个错误,是运行时报vector iterator incompatible,一般这种问题是向量和迭代器的类型不兼容,或者是进行迭代器判等时前后向量的结构发生变化,如erase操作之后 ...
sizeof、strlen、字符串、数组，整到一块，你还清楚吗？
写在前面 sizeof.strlen.字符串.数组,提到这些概念,相信学过C语言的人都能耳熟能详,也能谈得头头是道,但是,在实际运用中,当这些内容交织在一起时,大家却不一定能搞地清清楚楚,本文的目的正 ...

随机推荐

ORA-12154：TNS：无法解析指定的连接标识符
ORA-12154:TNS:无法解析指定的连接标识符 1问题的描述 Oracle11g server 64bit服务器端安装在Windows Server2008 Enterprise上,安装Orac ...
apache-commons-net Ftp 进行文件、文件夹的上传下载及日志的输出
用到了apache 的 commons-net-3.0.1.jar 和 log4j-1.2.15.jar 这连个jar包 JAVA 代码如下: package com.bjut.edu.cn.ftp; ...
小学生四则运算C/C++编程设计思想
题目: 1.题目避免重复: 2.可定制(数量(打印方式)): 3.可控制下列参数:是否有乘除法.是否有括号.数值范围.加减有无负数. 除法有无余数.是否支持分 ...
public、protect、private在父类子类中使用
先贴出一张,直观的.估计大家都见过的关于public.protect.private的范围图作用域当前类同一package 子孙类其他package public T ...
自动回复消息-微信公众平台开发4（asp.net）
接着上一节的processRequest 处理函数,代码如下: /// <summary> /// 处理微信发来的请求 /// </summary> /// ...
移动端 js touch事件
随着智能手机和平板电脑的普及, 越来越多的人用移动设备浏览网页,我们平时在pc浏览器上用的鼠标事件,比如:click, mouseover等, 已经无法满足移动设备触摸屏的特点,触摸时代的到来,离不开 ...
line-height:150%和line-height:1.5的区别
base都是font-size,不管是继承的,还是自身的. "%":为继承父元素的距离 "无单位":计算各自的距离. 看demo1: 样式 body{ font ...
MyEclipse: Can't load IA 32-bit .dll on a AMD 64-bit platform
java.lang.UnsatisfiedLinkError: D:\Tomcat7\apache-tomcat-7.0.59\bin\tcnative-1.dll: Can't load IA 32 ...
C# Redis
概念 Redis是一个开源的使用ANSI C语言编写.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库,和Memcached类似,它支持存储的value类型相对更多,包括string( ...
linux 访问ntfs分区
打开ntfs-3g的下载点http://www.tuxera.com/community/ntfs-3g-download/ ,将最新稳定(当前最新版本为ntfs-3g-2011.1.15)下载到Ce ...

关于strlen

关于strlen的更多相关文章

随机推荐

热门专题