解决NSData转NSString返回nil的问题
// 字符串转Data
NSString *str =@"jesfds";
NSData *data =[str dataUsingEncoding:NSUTF8StringEncoding];
//NSData 转NSString
NSString *result =[[ NSString alloc] initWithData:data encoding:NSUTF8StringEncoding]; //data 转char
NSData *data;
char *test=[data bytes]; // char 转data
byte* tempData = malloc(sizeof(byte)*);
NSData *content=[NSData dataWithBytes:tempData length:];
在使用initWithData等方法将NSData转换成NSString时,如果NSData的内容含有非encoding编码的字符,将会返回nil。
----------SDK文档如下-------------
- (instancetype)initWithData:(NSData *)data encoding:(NSStringEncoding)encoding;
Return Value
An NSString object initialized by converting the bytes in data into Unicode characters using encoding. The returned object may be different from the original receiver. Returns nil if the initialization fails for some reason (for example if data does not represent valid data for encoding).
-----------------------------
这个结果在很多时候可能并不是我们所希望的,比如在获取网页源码进行分析等方面,如果页面采用了utf-8编码,只是含有个别非utf-8字符,我们更希望转换NSString成功,抛弃(或替换)那些非法字符。
按照utf8格式标准
|
Unicode/UCS-4
|
bit数
|
UTF-8
|
byte数
|
范围(16进制)
|
|
0000 ~
007F
|
0~7
|
0XXX XXXX
|
1
|
0x - 7x |
|
0080 ~
07FF
|
8~11
|
110X XXXX
10XX XXXX
|
2
|
Cx 8x - Dx Bx |
|
0800 ~
FFFF
|
12~16
|
1110XXXX
10XX XXXX
10XX XXXX
|
3
|
Ex 8x 8x - Ex Bx Bx
|
|
1 0000 ~
1F FFFF
|
17~21
|
1111 0XXX
10XX XXXX
10XX XXXX
10XX XXXX
|
4
|
F8 8x 8x 8x 8x - FB Bx Bx Bx Bx
|
|
20 0000 ~
3FF FFFF
|
22~26
|
1111 10XX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
|
5
|
FC 8x 8x 8x 8x 8x - FD Bx Bx Bx Bx Bx |
|
400 0000 ~
7FFF FFFF
|
27~31
|
1111 110X
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
|
6
|
如果一个字节小于0x80,那么他就是一个字符;
如果大于C0小于E0,表示2个字节组成的utf8字符(第一个是110开头的,第二个是10开头的);
如果大于E0小于F0,表示3个字节组成的utf8字符(第一个是1110开头的,第二个是10开头的,第三个是10开头的);
以此类推,如果不符合utf-8规则,则表示一个非法字符,只要替换这样的字符即可。
实现方法如下(此实现可用但不够严谨,如用于工程中建议进行优化):
- //替换非utf8字符
- //注意:如果是三字节utf-8,第二字节错误,则先替换第一字节内容(认为此字节误码为三字节utf8的头),然后判断剩下的两个字节是否非法;
- - (NSData *)replaceNoUtf8:(NSData *)data
- {
- char aa[] = {'A','A','A','A','A','A'}; //utf8最多6个字符,当前方法未使用
- NSMutableData *md = [NSMutableData dataWithData:data];
- int loc = 0;
- while(loc < [md length])
- {
- char buffer;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0x80) == 0)
- {
- loc++;
- continue;
- }
- else if((buffer & 0xE0) == 0xC0)
- {
- loc++;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0xC0) == 0x80)
- {
- loc++;
- continue;
- }
- loc--;
- //非法字符,将这个字符(一个byte)替换为A
- [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
- loc++;
- continue;
- }
- else if((buffer & 0xF0) == 0xE0)
- {
- loc++;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0xC0) == 0x80)
- {
- loc++;
- [md getBytes:&buffer range:NSMakeRange(loc, 1)];
- if((buffer & 0xC0) == 0x80)
- {
- loc++;
- continue;
- }
- loc--;
- }
- loc--;
- //非法字符,将这个字符(一个byte)替换为A
- [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
- loc++;
- continue;
- }
- else
- {
- //非法字符,将这个字符(一个byte)替换为A
- [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
- loc++;
- continue;
- }
- }
- return md;
- }
转换后的NSData就可以正确转换为NSString了。
*如果是非utf-8编码,请自行对对应照编码协议转换。
解决NSData转NSString返回nil的问题的更多相关文章
- iOS解决NSData转NSString后字符为空
iOS中,将NSData转NSString的一般方法为[[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];但是当dat ...
- 为什么有时候NSData转换成NSString的时候返回nil
为什么有时候NSData转换成NSString的时候返回nil 有时候,NSData明明有值,可是,当转换成NSString的时候,却没有值,现在来进行测试:) -现在提供测试用素材- 源码如下: / ...
- 解决 pathForResource 返回 nil的问题
点击(此处)折叠或打开 NSString* path = [[NSBundle mainBundle] pathForResource:@"sample" ofType:@&quo ...
- NSData和NSString 、 NSFileManager
1 NSData和NSMutableData的基本使用 1.1 问题 NSData类是IOS提供的用于以二进制的形式操作文件数据的类,NSData有两个常用的属性length和bytes,length ...
- NSData、NSString 、 NSFileManager
1 NSData和NSMutableData的基本使用 1.1 问题 NSData类是IOS提供的用于以二进制的形式操作文件数据的类,NSData有两个常用的属性length和bytes,leng ...
- ios 数据类型转换 UIImage转换为NSData NSData转换为NSString
1.UIImage转换为NSData NSData *data;if (UIImagePNGRepresentation(image) == nil) { data = UIImageJPEGRepr ...
- NSData NSDate NSString NSArray NSDictionary 相互转换
// NSData NSDate NSString NSArray NSDictionary json NSString *string = @"hello word"; NSDa ...
- NSData NSDate NSString NSArray NSDictionary 相互转化
// NSData NSDate NSString NSArray NSDictionary json NSString *string = @"hello word"; ...
- 如何解决结果由block返回情况下的同步问题(转)
开发中经常会遇到一种简单的同步问题: 系统在获取资源时,采用了block写法,外部逻辑需要的结果是在block回调中返回的 举个例子: 请求获取通讯录权限的系统弹窗 调用系统方法请求通讯录权限: AB ...
随机推荐
- 76 mkswaP-用于设置交换区
Linux mkswap命令用于设置交换区(swap area). mkswap可将磁盘分区或文件设为Linux的交换区. 语法 mkswap [-cf][-v0][-v1][设备名称或文件][交换区 ...
- JS中的进制转换以及作用
js的进制转换, 分为2进制,8进制,10进制,16进制之间的相互转换, 我们直接利用 对象.toString()即可实现: //10进制转为16进制 ().toString() // =>&q ...
- Mvc视图引擎、寻址规则
目前MVC中用的较多的视图引擎应该是WebFormViewEngine和RazorViewEngine了. 一个Request请求首先会进入Routing进行判断,对于错误的url是不能被路由匹配到的 ...
- <<< 数据库基础知识
相关概念: 1.数据 (DATA) : 数据是描述现实世界事物的符号标记, 是指用物理符号记录下来的可以鉴别的信息. 包括:数字.文字.图形.声音.及其他特殊符号 2.数据库(DATABASE) :按 ...
- hibernate的集中持久化方法的区别
一.预备知识 在所有之前,说明一下,对于hibernate,它的对象有三种状态,transient.persistent.detached 下边是常见的翻译办法: transient:瞬态或者自由态 ...
- 基于dom的xss漏洞原理
原文:http://www.anying.org/thread-36-1-1.html转载必须注明原文地址最近看到网络上很多人都在说XSS我就借着暗影这个平台发表下自己对这一块的一些认识.其实对于XS ...
- NodeJs框架
Node.js非常适用于Web开发,但是现在无论是一个网站,还是Web App都已经成为包括很多不同部分,如前端.数据库.业务模块.功能模块等等的大型项目,使用Node.js从零开始进行Web开发,也 ...
- 【JWT】JWT+HA256加密 Token验证
目录 Token验证 传统的Token验证 JWT+HA256验证 回到顶部 Token验证 最近了解下基于 Token 的身份验证,跟大伙分享下.很多大型网站也都在用,比如 Facebook,Twi ...
- func_get_arg、func_get_args、func_num_args实现PHP伪重载
今天在看书的时候,发现书上有这么一条:函数重载的替代方法——伪重载 确实,在PHP中没有函数重载这个概念,让很多时候我们无法进行一些处理,甚至有时候不得不在函数后面定义好N个参数在看到了func_ge ...
- 【转】PHP curl CURLOPT_HTTPHEADER设置HOST
为了安全,我们的web服务主机往往不能上网.维护的时候,也是通过跳板机,ssh登录后去操作. 有时候我们的程序需要访问外网.比如需要调用外网其他程序的某个接口.这下该怎么办呢? 我们可以通过PHP的C ...