-- local function checkPlayName( str )

-- str = Utils.utf8_to_unicode(str)
-- local retStr = ""
-- local num = 0
-- local lenInByte = #str
-- local x = 1

-- for i=1,lenInByte do
-- i = x
-- local curByte = string.byte(str, x)
-- local byteCount = 1;
-- if curByte>0 and curByte<=127 then
-- byteCount = 1
-- elseif curByte>127 and curByte<240 then
-- byteCount = 3
-- elseif curByte>=240 and curByte<=247 then
-- byteCount = 4
-- end
-- local curStr = string.sub(str, i, i+byteCount-1)
-- retStr = retStr .. curStr
-- x = x + byteCount
-- if x >= lenInByte then
-- local finalRetStr = Utils.unicode_to_utf8(retStr)
-- return finalRetStr
-- end
-- num = num + 1
-- if num >= 24 then
-- retStr = retStr.."..."
-- local finalRetStr = Utils.unicode_to_utf8(retStr)
-- return finalRetStr
-- end
-- end
-- local finalRetStr = Utils.unicode_to_utf8(retStr)
-- return finalRetStr
-- end
-- Utils.checkPlayName = checkPlayName

-- local bit = require("bit")

-- local function unicode_to_utf8(convertStr)

-- if type(convertStr)~="string" then
-- return convertStr
-- end

-- local resultStr=""
-- local i=1
-- while true do

-- local num1=string.byte(convertStr,i)
-- local unicode

-- if num1~=nil and string.sub(convertStr,i,i+1)=="\\u" then
-- unicode=tonumber("0x"..string.sub(convertStr,i+2,i+5))
-- i=i+6
-- elseif num1~=nil then
-- unicode=num1
-- i=i+1
-- else
-- break
-- end

-- print(unicode)

-- if unicode <= 0x007f then

-- resultStr=resultStr..string.char(bit.band(unicode,0x7f))

-- elseif unicode >= 0x0080 and unicode <= 0x07ff then

-- resultStr=resultStr..string.char(bit.bor(0xc0,bit.band(bit.rshift(unicode,6),0x1f)))

-- resultStr=resultStr..string.char(bit.bor(0x80,bit.band(unicode,0x3f)))

-- elseif unicode >= 0x0800 and unicode <= 0xffff then

-- resultStr=resultStr..string.char(bit.bor(0xe0,bit.band(bit.rshift(unicode,12),0x0f)))

-- resultStr=resultStr..string.char(bit.bor(0x80,bit.band(bit.rshift(unicode,6),0x3f)))

-- resultStr=resultStr..string.char(bit.bor(0x80,bit.band(unicode,0x3f)))

-- end

-- end

-- resultStr=resultStr..'\0'

-- print(resultStr)

-- return resultStr

-- end
-- Utils.unicode_to_utf8 = unicode_to_utf8

-- local function utf8_to_unicode(convertStr)

-- if type(convertStr)~="string" then
-- return convertStr
-- end

-- local resultStr=""
-- local i=1
-- local num1=string.byte(convertStr,i)

-- while num1~=nil do

-- print(num1)

-- local tempVar1,tempVar2

-- if num1 >= 0x00 and num1 <= 0x7f then

-- tempVar1=num1

-- tempVar2=0

-- elseif bit.band(num1,0xe0)== 0xc0 then

-- local t1 = 0
-- local t2 = 0

-- t1 = bit.band(num1,bit.rshift(0xff,3))
-- i=i+1
-- num1=string.byte(convertStr,i)

-- t2 = bit.band(num1,bit.rshift(0xff,2))

-- tempVar1=bit.bor(t2,bit.lshift(bit.band(t1,bit.rshift(0xff,6)),6))

-- tempVar2=bit.rshift(t1,2)

-- elseif bit.band(num1,0xf0)== 0xe0 then

-- local t1 = 0
-- local t2 = 0
-- local t3 = 0

-- t1 = bit.band(num1,bit.rshift(0xff,3))
-- i=i+1
-- num1=string.byte(convertStr,i)
-- t2 = bit.band(num1,bit.rshift(0xff,2))
-- i=i+1
-- num1=string.byte(convertStr,i)
-- t3 = bit.band(num1,bit.rshift(0xff,2))

-- tempVar1=bit.bor(bit.lshift(bit.band(t2,bit.rshift(0xff,6)),6),t3)
-- tempVar2=bit.bor(bit.lshift(t1,4),bit.rshift(t2,2))

-- end

-- resultStr=resultStr..string.format("\\u%02x%02x",tempVar2,tempVar1)
-- print(resultStr)

-- i=i+1
-- num1=string.byte(convertStr,i)
-- end

-- print(resultStr)

-- return resultStr

-- end
-- Utils.utf8_to_unicode = utf8_to_unicode

无视编码都统一转成unicode 然后截断 例如 。“发发发发发发” 操作之后显示为 “发发发发...”的更多相关文章

  1. 不同格式的ip 统一转成ip列表

    支持以下格式的ip地址: 192.168.1.0/24 192.168.1.1-23 192.168.1.123 代码如下: package finder; import java.net.InetA ...

  2. 编码GBK和GB2312、Unicode、UTF-8

    一.编码GBK和GB2312 随着计算机发展,各国已经不满足于单纯用ASCII码: 对于我们来说能在计算机中显示中文字符是至关重要的,所以我们还需要一张关于中文和数字对应的关系表: 一个字节8位二进制 ...

  3. 控制台程序的中文输出乱码问题(export LC_CTYPE=zh_CN.GBK,或者修改/etc/sysconfig/i18n为zh_CN.GBK。使用setlocale(LC_CTYPE, "");会使用默认办法。编译器会将源码做转换成Unicode格式,或者指定gcc的输入文件的编码参数-finput-charset=GBK。Linux下应该用wprintf(L"%ls/n",wstr))

    今天发现用securecrt登陆时,gcc编译出错时会出现乱码,但直接在主机的窗口界面下用Shell编译却没有乱码.查看了一下当时的错误描述,发现它的引号是中文引号,导致在SecureCRT中显示出错 ...

  4. 字符编码笔记:ASCII,Unicode和UTF-8

    很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节". 再后来,他们又做了一些可以处理 ...

  5. 字符编码笔记:ASCII,Unicode和UTF-8 转

    本文出处 http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 只是为了记录一下省得要去搜. 今天中午,我突然想搞清楚 ...

  6. [转]字符编码笔记:ASCII,Unicode和UTF-8

    转自:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 作者: 阮一峰 日期: 2007年10月28日 今天中午, ...

  7. 字符编码笔记:ASCII,Unicode和UTF-8(转载)

    作者: 阮一峰 日期: 2007年10月28日 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步 ...

  8. UTF-8编码的字符串拆分成单字、获取UTF-8字符串的字符个数的代码及原理

    一.字符编码简介 1. ASCII码 在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(by ...

  9. 字符编码笔记:ASCII,Unicode和UTF-8【转载】

    作者: 阮一峰 日期: 2007年10月28日 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料. 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步 ...

随机推荐

  1. QT中添加 动态库(.so) 和 静态库 (.a) 的方法

    在QT 的Makefile文件中: 1 添加动态库,如lipcap.so 则,在LIBS一行中添加“-L/usr/local/lib -lpcap”,依据自己的情况修改libpcap.so的路径 2 ...

  2. LNMP的并发配置和资源分配

    PHP程序性能如何?程序的并发可以达到多少?程序的瓶颈在哪儿?为了满足业务需求应该购买多少台服务器?负载均衡中php应用服务器需要多少台? LNMP中的N是nginx充当Web Server 内容的分 ...

  3. 数据分析之pandas01

    Series 一.Series Series是一种类似于一维数组的对象,有两部分组成:     .values:一组数据(ndarray类型)     .index: 相关的数据索引标签 二.seri ...

  4. excel 方框打钩

    将光标定位于需要打钩的地方,选择[插入]→[符号]→[其他符号] 在弹出的符号栏里,字体一定要改成[Windings2] 然后在符号栏便可以找到现成的打钩样式,点击插入,再关闭即可 提示:如果需要打叉 ...

  5. css overflow和float

    float:使元素向左或向右移动(不能上下移动),直到它的外边缘碰到包含框或另一个浮动框的边框为止,浮动元素之前的元素将不会受到影响,之后的元素将围绕它. float之后的元素脱离文档流. 默认为no ...

  6. Django XSS攻击

    Django XSS攻击 XSS(cross-site scripting跨域脚本攻击)攻击是最常见的web攻击,其特点是“跨域”和“客户端执行”,XSS攻击分为三种: Reflected XSS(基 ...

  7. Spring Boot(十五):spring boot+jpa+thymeleaf增删改查示例

    Spring Boot(十五):spring boot+jpa+thymeleaf增删改查示例 一.快速上手 1,配置文件 (1)pom包配置 pom包里面添加jpa和thymeleaf的相关包引用 ...

  8. 【题解】Luogu UVA12345 Dynamic len(set(a[L:R]))

    原题传送门 这题要用动态莫队,我博客里有介绍 这道题和luogu P1903 [国家集训队]数颜色 / 维护队列差不多,解法就在上面那篇博客里qaq 主要的问题是如何排序? 排序有三个关键字: 1.左 ...

  9. python简说(十六)第三方模块安装

    安装第三模块 1.pip install xxx pip问题 1.提示没有pip命令的, 把python的安装目录. 安装目录下面的scripts目录加入到环境变量里面 2.Unknown or un ...

  10. 自动发现实现url+响应时间监控

    url自动发现脚本: [root@jenkins scripts]# cat  urlDiscovery.py #!/usr/bin/env python #coding:utf-8 import o ...