IOS 实现TXT文本自动识别编码的方法
from :http://kyoworkios.blog.51cto.com/878347/1344013
TXT识别编码是个复杂的问题。幸好有c/c++的一个库能识别。
库的叫uchardet,可以自己去github下载。但是没有具体的使用手册什么的。小研究了下 。
把uchardet文件夹下的.h和.cpp和.tab文件全部copy到自己的应用里面。然后在要自动识别编码的地方
#include "uchardet.h"
如下代码实现。
//
// EBOOKReadViewController.m
// EBOOk
//
// Created by 赵锋 on 13-12-18.
// Copyright (c) 2013年赵锋. All rights reserved.
//
#import "EBOOKReadViewController.h"
#include "uchardet.h"
#define NUMBER_OF_SAMPLES (2048)
@interfaceEBOOKReadViewController ()
{
constchar *encode;
}
@end
@implementation EBOOKReadViewController
- (id)initWithNibName:(NSString *)nibNameOrNil bundle:(NSBundle *)nibBundleOrNil
{
self = [superinitWithNibName:nibNameOrNil bundle:nibBundleOrNil];
if (self) {
// Custom initialization
}
returnself;
}
- (void)viewDidLoad
{
[superviewDidLoad];
NSString *path=[[NSBundlemainBundle] pathForResource:@"五界至尊" ofType:@"txt"];
int result=[selfhaveTextBianMa:[path UTF8String]];
CFStringEncoding cfEncode = 0;
if (result==0) {
NSString *encodeStr=[[NSStringalloc] initWithCString:encodeencoding:NSUTF8StringEncoding];
if ([encodeStr isEqualToString:@"gb18030"]) {
cfEncode= kCFStringEncodingGB_18030_2000;
}elseif([encodeStr isEqualToString:@"Big5"]){
cfEncode= kCFStringEncodingBig5;
}elseif([encodeStr isEqualToString:@"UTF-8"]){
cfEncode= kCFStringEncodingUTF8;
}elseif([encodeStr isEqualToString:@"Shift_JIS"]){
cfEncode= kCFStringEncodingShiftJIS;
}elseif([encodeStr isEqualToString:@"windows-1252"]){
cfEncode= kCFStringEncodingWindowsLatin1;
}elseif([encodeStr isEqualToString:@"x-euc-tw"]){
cfEncode= kCFStringEncodingEUC_TW;
}elseif([encodeStr isEqualToString:@"EUC-KR"]){
cfEncode= kCFStringEncodingEUC_KR;
}elseif([encodeStr isEqualToString:@"EUC-JP"]){
cfEncode= kCFStringEncodingEUC_JP;
}
}
NSError *err;
NSString *str=[NSStringstringWithContentsOfFile:pathencoding:CFStringConvertEncodingToNSStringEncoding(cfEncode) error:&err];
NSString *st=[str substringToIndex:1000];
self.txtView.text=st;
}
-(int)haveTextBianMa:(constchar*)strTxtPath{
FILE* file;
char buf[NUMBER_OF_SAMPLES];
size_t len;
uchardet_t ud;
/* 打开被检测文本文件,并读取一定数量的样本字符 */
file = fopen(strTxtPath, "rt");
if (file==NULL) {
printf("文件打开失败!\n");
return1;
}
len = fread(buf, sizeof(char), NUMBER_OF_SAMPLES, file);
fclose(file);
ud = uchardet_new();
if(uchardet_handle_data(ud, buf, len) != 0)
{
printf("分析编码失败!\n");
return -1;
}
uchardet_data_end(ud);
printf("文本的编码方式是%s。\n", uchardet_get_charset(ud));
encode=uchardet_get_charset(ud);
uchardet_delete(ud);
return0;
}
- (void)didReceiveMemoryWarning
{
[superdidReceiveMemoryWarning];
// Dispose of any resources that can be recreated.
}
@end
IOS 实现TXT文本自动识别编码的方法的更多相关文章
- Sublime打开txt文本乱码的解决方法
Ctrl + Shift + P打开命令行 输入 install ,先安装 Package Control 安装成功会提示你 现在你可以使用命令面板并键入“install package”开始 然后 ...
- ajax读取txt文本时乱码的解决方案
前言:第一次学习使用 ajax 就是用来读取文本 先给出现乱码的代码<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional/ ...
- Python中将变量按行写入txt文本中
案例一: 讲数组a 循环写入名称为2.txt的文档中 # -*-coding:utf8-*- import requests from lxml import etree a=[1,2,3,4,5,6 ...
- 使用多字节字符集的跨平台(PC、Android、IOS、WP)编码/解码方法
随着移动端的发展,跨平台已成为通讯架构设计的重要考虑因素,PC.Android.IOS.WP等跨多平台间的数据通讯,必然要解决字符编码/解码的问题. 多字节字符集MBCS不是跨平台的首选字符集,面向跨 ...
- iOS之UI--富文本总结
文章内容大纲 1.NSMutableAttributedString的基本使用 2.NSMutableAttributedString的简易封装 3.使用开源代码GOBMarkupPaser处理富文本 ...
- linux下打开txt显示乱码的解决方法
Linux打开txt文件乱码的解决方法 Linux显示在Windows编辑过的中文就会显示乱码是由于两个操作系统使用的编码不同所致.Linux下使用的编码是utf8,而Windows使用的是gb1 ...
- Qt txt文本中获取字符串的问题
QT对txt文本进行读写一般是采用QFile和QTextStream结合使用,在此不细说,主要说一下读取txt文本的注意事项.因为txt文本中有中文也有英文还有数字,要准确获得需要的字串可就要多一个心 ...
- Qt程序设计——txt文本中获取字符串的问题
QT对txt文本进行读写一般是采用QFile和QTextStream结合使用,在此不细说,主要说一下读取txt文本的注意事项.因为txt文本中有中文也有英文还有数字,要准确获得需要的字串可就要多一个心 ...
- 用C#实现的两个试验编程(txt文本数据的导入,和数据导出为TXT)
1. 文件的存取 数据文件1.txt为学生成绩统计表,要对它做一个统计工作.文件中若一个人有多个成绩,则取他们的最好成绩来统计,然后计算全班平均成绩:统计0-69.70-79.80-89.90-100 ...
随机推荐
- nodejs的重要支柱
概念:模块(Module)和包(Package)是Node.js最重要的支柱. 开发一个具有一定规模的程序不可能只用一个文件,通常需要把各个功能拆分.分装.然后组合起来.模块正式为了实现这种方式而诞生 ...
- ffmpeg合并多个视频
实例1: 把4个视频(1.f4v, 2.f4v, 3.f4v, 4.f4v)合并成一个文件(out.mp4) 基本无损,而且速度飞快! #-vcodec copy -acodec copy == ...
- dfs和bfs的简单总结
首先是dfs,又名深度优先搜索.看名字就知道,它的核心思想就是一直搜索,先在一条路上面一路撸到底,如果到底没有办法前进了,那么判断是否到达终点,如果没有到达,那么就回溯到之前的点再撸. dfs的要点: ...
- mongodb综述
摘要:mongodb相对于mysql的优势在于性能和分布式扩展方面
- Base64笔记
1. 昨天的<MIME笔记>中提到,MIME主要使用两种编码转换方式----Quoted-printable和Base64----将8位的非英语字符转化为7位的ASCII字符. 虽然这样的 ...
- Javascript面向对象编程(二):构造函数的继承
这个系列的第一部分,主要介绍了如何"封装"数据和方法,以及如何从原型对象生成实例. 今天要介绍的是,对象之间的"继承"的五种方法. 比如,现在有一个" ...
- winxp iis5中修改最大连接数及添加多个站点
winxp iis5中修改最大连接数及添加多个站点 最 近用asp做一些东西,需要用到iis,还需要用photoshop做一些图片.以前都是在win2003下面做,可是photoshop里面很多中文字 ...
- HDU 2612 Find a way BFS,防止超时是关键
之前我写的时候是:每找到一个‘@’就广搜一次,如果这样写有多少个‘@’就会广搜几次,这样就超时了.我队友告诉我应该打个表,这个方法确实不错.因为'Y'和'M'是唯一的,我通过这两个点分别广搜一次,对所 ...
- Error Code: 1175. You are using safe update mode and you tried to update a table without a WHERE that uses a KEY column To disable safe mode, toggle the option in Preferences -> SQL Queries and reconn
使用MySQL执行update的时候报错: MySQL 在使用mysql执行update的时候,如果不是用主键当where语句,会报如下错误,使用主键用于where语句中正常. 异常内容: ...
- UIScrollView 和 UIPageControl
UIScrollView [滚动视图]非常重要 UIScrollView是滚动视图,是其它带有滚动功能视图的父类, 本身不显示或者只显示背景,主要负责子视图的滚动和翻页. 一.常用属性 1.基本方法 ...