1.字符串长度

PHP获取中英文混合字符串长度的实现代码如下,1中文=1位,2英文=1位,可自行修改

  1. /**
  2. * PHP获取字符串中英文混合长度
  3. * @param $str string 字符串
  4. * @param $$charset string 编码
  5. * @return 返回长度,1中文=1位,2英文=1位
  6. */
  7. function strLength($str,$charset='utf-8'){
  8. if($charset=='utf-8') $str = iconv('utf-8','gb2312',$str);
  9. $num = strlen($str);
  10. $cnNum = 0;
  11. for($i=0;$i<$num;$i++){
  12. if(ord(substr($str,$i+1,1))>127){
  13. $cnNum++;
  14. $i++;
  15. }
  16. }
  17. $enNum = $num-($cnNum*2);
  18. $number = ($enNum/2)+$cnNum;
  19. return ceil($number);
  20. }
  21. //测试输出长度都为15
  22. $str1 = '测试测试测试测试测试测试测试测';
  23. $str2 = 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa';
  24. $str3 = 'aa测试aa测试aa测试aa测试aaaaaa';
  25. echo strLength($str1,'gb2312');
  26. echo strLength($str2,'gb2312');
  27. echo strLength($str3,'gb2312');

2.截取字符串函数

UTF8编码,在UTF8中,一个中文字符占3个字节

  1. $tmpstr = "";
  2. $strlen = $start + $len;
  3. for($i = 0; $i < $strlen; $i++){
  4. if(ord(substr($str, $i, 1)) > 127){
  5. $tmpstr.=substr($str, $i, 3);
  6. $i+=2;
  7. }else
  8. $tmpstr.= substr($str, $i, 1);
  9. }
  10. return $tmpstr;
  11. }
  12. echo msubstr("一二三天下致公english",0,10);

GB2312编码,在gb2312中,一个中文字符占2个字节

  1. function msubstr($str, $start, $len) {   //ȡ
  2. $tmpstr = "";
  3. $strlen = $start + $len;
  4. if(preg_match('/[/d/s]{2,}/',$str)){$strlen=$strlen-2;}
  5. for($i = 0; $i < $strlen; $i++) {
  6. if(ord(substr($str, $i, 1)) > 0xa0) {
  7. $tmpstr .= substr($str, $i, 2);
  8. $i++;
  9. } else
  10. $tmpstr .= substr($str, $i, 1);
  11. }
  12. return $tmpstr;
  13. }
  14. ?>

编码兼容性良好的函数

    1. {
    2. if(function_exists("mb_substr"))
    3. return mb_substr($str, $start, $length, $charset);
    4. elseif(function_exists('iconv_substr')) {
    5. return iconv_substr($str,$start,$length,$charset);
    6. }
    7. $re['utf-8']   = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}/";
    8. $re['gb2312'] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/";
    9. $re['gbk']    = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";
    10. $re['big5']   = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";
    11. preg_match_all($re[$charset], $str, $match);
    12. $slice = join("",array_slice($match[0], $start, $length));
    13. if($suffix) return $slice."…";
    14. return $slice;
    15. }

PHP获取中英文混合字符串长度及截取的更多相关文章

  1. PHP中获取中英文混合字符串长度[主要是指个数,而不是字符串长度](转)

    今晚在写框架的表单验证类时,需要判断某个字符串长度是否在指定区间内,很自然地,想到了PHP中的strlen函数. $str = 'Hello world!'; echo strlen($str);   ...

  2. PHP 获取中英文混合字符串长度

    通常情况下要想掌握一个字符串变量的长度[一般掌握其字数],自然想到 strlen |--   $str = 'string'; echo strlen($str); //6 .csharpcode, ...

  3. CSS截取中英文混合字符串长度

    <!doctype html> <html> <head> <meta http-equiv="content-type" content ...

  4. PHP针对中英文混合字符串长度判断及截取方法

    PHP自带的函数如strlen().mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节.例: $enStr = 'Hello,China!'; echo str ...

  5. php 中英文混合字符串长度计算

    (strlen($string) + mb_strlen($string,'UTF8')) / 2;tw 这样计算的

  6. js 计算中英文混合字符串长度

    转载请注明来源:https://www.cnblogs.com/hookjc/ function isChinese(str) {    var lst = /[u00-uFF]/;          ...

  7. C#与JS实现 获取指定字节长度 中英文混合字符串 的方法

    平时在作数据库插入操作时,如果用 INSERT 语句向一个varchar型字段插入内容时,有时会因为插入的内容长度超出规定的长度而报错. 尤其是插入中英文混合字符串时,SQL Server中一般中文要 ...

  8. 用C#截取指定长度的中英文混合字符串

    很早以前写过一篇文章(用C#截取指定长度的中英文混合字符串),但是对性能没有测试,有人说我写的这个方法性能有问题,后来想,可能真会有BT之需求要求传入一个几万K甚至几M体积的字符串进来,那将会影响正则 ...

  9. c#的中英文混合字符串截取指定长度,startidx从0开始

    //c#的中英文混合字符串截取指定长度,startidx从0开始 by gisoracle@126.com public string getStrLenB(string str, int start ...

随机推荐

  1. ubuntu16.04 server安装小记

    由于本人有一台闲置的thinkpad电脑,所以打算在上边安装一个ubuntu16.04 server版本,其中遇到主要问题,做一下记录: 安装过程中出现“ubuntu16.04 server64 bu ...

  2. js参数截取

    原代码: function GetQueryString(name) { var reg = new RegExp("(^|&)" + name + "=([^& ...

  3. Asp.net中实现同一用户名同时登陆,注销先前用户(转)

    Web 项目中经常遇到的问题就是同一用户名多次登陆的问题,相应的解决办法也很多,总结起来不外乎这几种解决办法:将登陆后的用户名放到数据库表中:登陆后的用 户名放到Session中:登陆后的用户名放到A ...

  4. 后缀自动机/回文自动机/AC自动机/序列自动机----各种自动机(自冻鸡) 题目泛做

    题目1 BZOJ 3676 APIO2014 回文串 算法讨论: cnt表示回文自动机上每个结点回文串出现的次数.这是回文自动机的定义考查题. #include <cstdlib> #in ...

  5. Shell脚本中单引号(‘)和双引号(“)的使用区别[转载]

    shell可以识别4种不同类型的引字符号: 单引号字符' 双引号字符" 反斜杠字符\ 反引号字符` 1. 单引号 ( '' ) # grep Susan phonebook Susan Go ...

  6. Stata和Matlab联合处理金融数据

    Stata是统计学专业软件,可以很方便的对数据处理,但几乎只能按照整行整列进行,而且每次只能加载一个矩阵(dta文件),如果要用到多个矩阵数据进行操作或进行复杂的循环控制,就力不从心了. 而Matla ...

  7. js 框架及uI框架

    转载自:http://www.techweb.com.cn/network/system/2015-12-23/2245809.shtml 这篇文章主要描述现今流行的一些 Javascript web ...

  8. WordPress插件制作教程(八): 最后总结

    WordPress插件教程最后一篇,还是为大家简单的做下总结.这次插件制作教程讲的内容和知识点个人觉得不是很多,因为插件制作不单单是这些内容,它涉及的知识很多很多,不是说你会一些函数就可以做出一个好的 ...

  9. [php] PHP创建指定目录和文件

    前几天看到有人问PHP环境下如何创建文件到指定目录下,正好自己最近在学习,经过一翻测试,终于出结果了,贴出来与大家分享. 目录结构: 代码所在的文件wwwroot/mydir/test/test.ph ...

  10. Python正则匹配字母大小写不敏感在读xml中的应用

    需要解决的问题:要匹配字符串,字符串中字母的大小写不确定,如何匹配? 问题出现之前是使用字符串比较的方式,比如要匹配'abc',则用语句: if s == 'abc':#s为需要匹配的字符串 prin ...