将UTF8编码的3字节中英文转成2字节中英文.
1. 首先要考虑将String转成一个bytes的数组, 每个汉字是3个bytes, 英文或者标点是1个byte.
2. 然后去判断一下每一个byte的前面几个bit, 看下面的表, 1个byte的字符, 就是英文跟标点, 它的第1个bit是0;
3. 重点是3个bytes的字符, 就是汉字, 或者说CJK, 它的第1个byte的前面4个bit, 是1110, 那么我们可以根据这个来判断.看起来好像下面的代码, 居然是java跟oc可以共用的 :)
if((bytes[i]>>4)==0x0E){
highPos=(bytes[i]<<4)|((bytes[i+1]&0x3f)>>2);
lowPos=((bytes[i+1]&0x03)<<6)|(bytes[i+2]&0x3f);
//NSLog(@"highPos: %x lowPos: %x",highPos,lowPos);
chnCodeArray[chnCodeIndex]=highPos;
chnCodeArray[chnCodeIndex+1]=lowPos;
chnCodeIndex=chnCodeIndex+2;
i=i+3;
}else if(bytes[i]>>7==0){
chnCodeArray[chnCodeIndex]=0;
chnCodeArray[chnCodeIndex+1]=bytes[i];
chnCodeIndex=chnCodeIndex+2;
i++;
}
chnCodeArray就是用来存放结果的byte的数组.
4. 根据协议包, 先发送字符串开始, 数据, 结束的数据包.
[self sendPackage:UTF8_CODE_TRANS_START_CMD withCmdNumber:number withLength:length];
[self sendUTF8Data:utf8Bytes];
[self sendPackage:UTF8_CODE_TRANS_END_CMD withCmdNumber:number withLength:length];
可以看得出, 分别发送cmdPackage跟dataPackage, 可以写得更好的, 希望在安卓的版本中有更好的设计方法.
5. 简单看一下, sendPackage这个方法:
for(int i=0;i<3;i++){
UInt64 startTime=[[NSDate date] timeIntervalSince1970]*1000;
if(packageType==UTF8_CODE_TRANS_START_CMD){
_packageID=[self sendUTF8TransStartCMDPackage:cmdNumber withLength:length];
}else if(packageType==UTF8_CODE_TRANS_END_CMD){
_packageID=[self sendUTF8TransEndCMDPackage:cmdNumber withLength:length];
}
if([self waitForACK:startTime]){
return;
}
}
重试3次, 如果有ACK就算发送成功.
-(bool)waitForACK:(UInt64) startTime{
[self readFFF1Value];
while(_ack==0){
UInt64 endTime=[[NSDate date] timeIntervalSince1970]*1000;
if((endTime-startTime)>1000){
NSLog(@"Over time");
return 0;
}
if(_ack==1){
//NSLog(@"ack==1");
return 1;
}
}
return 0;
}
sendUTF8TransStartCMDPackage方法的精髓是, 妈的, 自己看吧:
_packageSendingType.packageType=UTF8_CODE_TRANS_START_CMD;
_packageSendingType.warningCode=cmdNumber;
_packageSendingType.packageLength=length;
int packageID=arc4random()%255;
NSData *data=[_blePackageFactory createPackage:_packageSendingType withPackageID:packageID];
[self writeCharFFF1:data];
_ack=0;
return packageID;
这里会返回一个随机产生的packageID, 因为app校验ack的时候, 要用到这个packageID.
-(void) checkACK:(NSData*)charValue{
Byte byteBuffer[20];
//NSLog(@"checkACK thread is: %@",[NSThread currentThread]);
//NSLog(@"%d",(int)[notifObj length]);
[charValue getBytes:byteBuffer length:20];
if((byteBuffer[3]==_packageID)&&(byteBuffer[4]==TYPE_DATA_ACK)&&(byteBuffer[5]==ACK_YES)){
_ack=1;
NSLog(@"ACK check ok");
_transferErrorCount=0;
[[NSNotificationCenter defaultCenter] postNotificationName:@"BLECharValue" object:@"ACK!"];
}else{
_transferErrorCount++;
if(_transferErrorCount>5){
_transferErrorCount=0;
[[NSNotificationCenter defaultCenter] postNotificationName:@"BLECharValue" object:@"传输错误"];
}else{
//[self sendStartPackage];
[self resendPackage];
}
}
}
这个方法是在读取char值的回调中运行的, 所以用上了一个外部的全局变量, 叫_ack
6. 总结一下, 配合之前规定的通讯协议, 这个蓝牙通讯, 无非两种包, 一种是命令包, 即通讯开始, 通讯结束, 一种是数据的传输.
关键是中间有很多信息, 例如, 包ID, 校验码, 字符串编号, 开始位, 停止位, 诸如此类...
将UTF8编码的3字节中英文转成2字节中英文.的更多相关文章
- 【异常记录(六)】vs文件乱码:文件加载,使用Unicode(UTF-8)编码加载文件xxx时,有些字节已用Unicode替换字符替换。保存该文件将不会保留原始文件内容。
VS2013偶遇这种情况,页面汉字编码出现乱码. .... 按照网上查到的: 工具>选项>文本编辑器> 勾选了 然并卵,还是乱码... 其实炒鸡简单 用记事本打开另存为,选择 ...
- 如何将一个用utf-8编码的文本用java程序转换成ANSI编码的文本
jdk有一个关于UTF-8的bug所以加了一句 br.skip(1); bugID: http://bugs.java.com/view_bug.do?bug_id=4508058 public st ...
- Java不同编码方式,中英文字符所占字节数
测试代码 public class Test { public static void main(String[] args){ String[] charsetNames={ "UTF-8 ...
- 【Java】如何检测、替换4个字节的utf-8编码(此范围编码包含emoji表情)
> 参考的优秀文章 1.十分钟搞清字符集和字符编码 2.Java中byte与16进制字符串的互相转换 3.[异常处理]Incorrect string value: '\xF0\x90\x8D\ ...
- 在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编
在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编 ...
- python中文utf8编码后是占3个字符,unicode汉字为2字节
一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写 def str_len(str): try: row_l=len(str) utf8_l=len(str.encode('utf-8') ...
- 刨根究底字符编码之十一——UTF-8编码方式与字节序标记
UTF-8编码方式与字节序标记 一.UTF-8编码方式 1. 接下来将分别介绍Unicode字符集的三种编码方式:UTF-8.UTF-16.UTF-32.这里先介绍应用最为广泛的UTF-8. 为满足基 ...
- 1个汉字在UTF-8编码占3个字节
http://blog.csdn.net/ns_code/article/details/14162087 http://www.ruanyifeng.com/blog/2007/10/ascii_u ...
- ASCII、Unicode和UTF-8编码的区别;中英文混合截取
ASCII编码是128个字符 中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准..... Unicode是为了解决各国乱码的,但浪费存储空间 UTF-8编码把一个Unicode字符 ...
随机推荐
- box_shadow
.tip{width:485px; height:260px; position:absolute;top:10%; left:30%;background:#fcfdfd; box-shadow:1 ...
- 测试环境下将centos6.8升级到centos7的操作记录(转)
在测试环境下安装openstack,由于在centos6下安装openstack,针对源的问题有很多,安装起来很不顺利! 但是在centos7下安装却很顺利,所以考虑将服务器由centos6升级到ce ...
- RedHat6.6更新Centos6yum源
RedHat6.6更新Centos6yum源 一. 删除自带的RedHat6.6yum源 1- rpm -qa|grep yum|xargs rpm -e --nodeps(不检查依 ...
- C#高级编程 反射 代码示例
反射 反射(Reflection)是.NET中的重要机制,通过反射,可以在运行时获得.NET中每一个类型(包括类.结构.委托.接口和枚举等)的成员,包括方法.属性.事件,以及构造函数等. 还可以获得每 ...
- [Machine Learning]k-NN
k-NN最近邻算法 基本思想: 对未知样本X,从训练样本集中获取与其最相近的k个样本,利用这k个样本的类别预测未知样本X的类别. 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大 ...
- Python_01 在DOS环境运行python程序
>怎么在DOS环境运行一个python程序 >>在文本编辑器中编辑程序,最后保存成 文件名.py 的格式 >>在DOS界面下找到源程序所在的路径,然后用 pyth ...
- mysql中all privileges包含哪些权限
mysql> grant all privileges on test.* to 'ybb'@'%' identified by 'ybb'; Query OK, 0 rows affected ...
- Java基础之写文件——在通道写入过程中的缓冲区状态(BufferStateTrace)
控制台程序,在Junk目录中将字符串“Garbage in, garbage out\n”写入到名为charData.txt的文件中. import static java.nio.file.Stan ...
- Tomcat系列之Java技术详解
一.概述 1.前言 在前面几篇博客中,我们和大家说了负载均衡器服务器.Web服务器.反向代理服务器.缓存服务器,从这篇博客开始我们和大家说说应用程序服务器,对于上述内容不了解的博友可以去参考一下我们前 ...
- Leetcode: Guess Number Higher or Lower II
e are playing the Guess Game. The game is as follows: I pick a number from 1 to n. You have to guess ...