上篇博客中主要说了GDAL库C#版本中存在的问题,其表现形式主要是:“文件名中的汉字个数是偶数,完全没有影响,读取和创建都正常,如果文件名中的汉字个数是奇数,读取和创建都会报错。

针对这个问题,今天仔细研究(查看+折腾)了下C#程序中string类型的默认编码方式。首先通过下面的代码进行检测C#程序中string类型的默认编码方式是什么。

static void Main(string[] args)
{
string s = "我"; // 首先获取默认编码的字节及其长度,并输出
byte[] bDefault =Encoding.Default.GetBytes(s);
Console.WriteLine(bDefault.Length);
foreach (byte b inbDefault)
{
Console.WriteLine(b);
} // 接下来获取Unicode编码的字节及其长度,并输出
byte[] bUnicode =Encoding.Unicode.GetBytes(s);
Console.WriteLine(bUnicode.Length);
foreach (byte b inbUnicode)
{
Console.WriteLine(b);
} // 接下来获取UTF8编码的字节及其长度,并输出
byte[] bUTF8 =Encoding.UTF8.GetBytes(s);
Console.WriteLine(bUTF8.Length);
foreach (byte b inbUTF8)
{
Console.WriteLine(b);
} // 最后获取936编码(即GB2312)的字节及其长度,并输出
byte[] b936 =Encoding.GetEncoding(936).GetBytes(s);
Console.WriteLine(b936.Length);
foreach (byte b in b936)
{
Console.WriteLine(b);
}
}

在XP64位中文操作系统与Win764位英文操作系统上运行过上面的代码片段,我们通过查看四个byte数组中的值,分别如下图所示。截图上面是十进制显示,下半部分为十六进制显示。

从上图可以清楚的看出,C#中对于汉字的默认编码应该使用的是GB2312(936)编码。这个默认的编码与操作系统也没有关系。

知道了系统默认的汉字编码方式,那么下面就来看看昨天的问题,使用代码System.Text.Encoding.Default.GetString(System.Text.Encoding.UTF8.GetBytes(utf8_path))转换后的编码到底变成了什么编码。使用下面的代码片段进行测试:

static void Main(string[] args)
{
string s = "我";
string strTEmp = System.Text.Encoding.Default.GetString(System.Text.Encoding.UTF8.GetBytes(s));
byte[] bDefault =Encoding.Default.GetBytes(strTEmp);
Console.WriteLine(bDefault.Length);
foreach (byte b inbDefault)
{
Console.WriteLine(b);
} Console.WriteLine(strTEmp);
}

通过监视查看发现通过上面的代码转换之后的字节与UTF8前两个一致,但是第三个已经变成了ASCII码中的63即问号“?”,但是系统当前认为字符串依旧是GB2312的编码,所以字符串出现了乱码。如下图所示。

接下来我们再看看这个字符串通过swig封装之后,传入GDAL库之后的C++语言对应的字节编码是什么,使用前两篇博客中的跨语言调试方式,直接将上面的字符串“我”用Ogr.Open函数打开,然后在C++库中的文件gdal-1.10.0\port\cpl_vsil_win32.cpp中的函数VSIVirtualHandle*VSIWin32FilesystemHandler::Open( const char *pszFilename,   const char *pszAccess )处添加断点来查看传入的字符串,如下图所示:

转换前后的字符串及其字节码如下:

通过对比这个图与上面C#的字节码,发现了一个问题。C#中的bDefault字节码是(230、136、63)转换为16进制为(0xe6、0x88、0x3f)与C++库中传入的字节码一致(pszFilename)。这也就是说,通过swig封装并传入C++库后,编码保持不变,依旧是那个错误的编码。也就是说通过代码System.Text.Encoding.Default.GetString(System.Text.Encoding.UTF8.GetBytes(utf8_path))进行转换造成了编码错误,那么只需要修改这里,不让他进行转码或者在将Default改成UTF8应该就行了。

按照这个思路,将swig\csharp目录下的所有的System.Text.Encoding.Default.GetString(System.Text.Encoding.UTF8.GetBytes(utf8_path))都改成System.Text.Encoding. UTF8.GetString(System.Text.Encoding.UTF8.GetBytes(utf8_path))进行测试。

共需改动的文件不多,共有四个文件,如下图所示:

修改时,使用批量替换即可。修改完重新编译GDAL的C#库,然后将编译好的八个dll重新加入工程中,按照上面的步骤再次进行调试。进入C++的代码中,监视编码转换前后的值的变化。如下图所示。

从上图可以看出,这里传入的字符串pszFilename的编码已经变成了(0xce、0xd2),这个编码就是C#里面的默认编码或者GB2312编码,也就不是UTF8编码了。那么我们就可以通过设置GDAL_FILENAME_IS_UTF8=NO来进行读取了。

接下来,我们使用一个原来不能打开的路径,然后将GDAL_FILENAME_IS_UTF8设置为NO,进行测试。调试代码如下图所示,从图中可以看出,原来不能打开的shp已经正常打开。

控制台输出的信息为:

经过测试,这样修改可以支持所有的中文及其英文路径了。测试环境为Xp64位中文操作系统与Win764位英文操作系统。

我已经将修改后的C#版本的8个dll打包上传至CSDN资源和qq群共享,直接替换之前GDAL110版本里面的原来的dll即可。CSDN下载地址为:http://download.csdn.net/detail/liminlu0314/5809463

浅析GDAL库C#版本支持中文路径问题(续)的更多相关文章

  1. 浅析GDAL库C#版本支持中文路径问题

    GDAL库对于C#的支持问题还是蛮多的,对于中文路径的支持就是其中之一(另一个就是通过OGR库获取图形的坐标信息). 关于C#支持中文路径,看过我之前博客的应该都不陌生,如果使用的是我修改过的GDAL ...

  2. GDAL支持中文路径和Shp文件中文属性写入

    在使用GDAL的过程中,为了支持中文,比需手动进行中文路径的设置,同时特别是在对Shp的属性进行中文输入的时候,都必须进行必要的设定. 为了支持中文路径,在注册了驱动之后,加上第三句就可以了.必须设置 ...

  3. svn不支持中文路径问题的解决

    作者:朱金灿 来源:http://blog.csdn.net/clever101 svn的授权文件authz默认是不支持中文路径的,因此在精确控制中文文件夹的授权时往往会出错.要解决这个问题,需要用U ...

  4. 使GDAL库支持中文路径或中文文件名的处理方法

    之前生成的gdal 2.1.1动态库,在通过命令行执行时,遇到有中文路径或中文图像名时,GDALOpen函数不能正确的被调用,如下图: 解决方法: 1.      在所有使用GDALAllRegist ...

  5. 解决tomcat不支持中文路径的问题

    问题描述: 开发文件下载功能时,因为需求比较简单,要求下载一个说明文件.于是,直接给出了文件所在服务器的地址,通过链接直接下载此文件(因需求简单,未考虑安全方面的问题-_-||). 在这个过程中,文件 ...

  6. 【转】让apache支持中文路径或者中文文件

    本帖最后由 狂人阿川 于 2013-4-12 19:13 编辑 今天在给一美国VPS客户调试他的程序的时候.发现他的网站有中文名称.貌似apache无法认识中文路径,火狐下面能下载他的文件,IE下面不 ...

  7. Unity3D 原来Unity比较新的版本支持中文

    注意: Unity 2018.2 以上版本才可以

  8. Jenkins的FTP上传插件Publish Over FTP Plugin设置支持中文路径

    [系统管理]->[系统设置]->[Publish over FTP]->[Control encoding]->输入[GB2312]或者[UTF-8]

  9. ImageMaigck不支持中文路径的问题

    不知道咋回事. 回顾下: char* pTest1 = "测试.txt"; wchar_t* pTest2 = L"测试.txt"; 以上是pTest1指向的内 ...

随机推荐

  1. 学习笔记:Zookeeper 应用案例(上下线动态感知)

    1.Zookeeper 应用案例(上下线动态感知) 8.1 案例1--服务器上下线动态感知 8.1.1 需求描述 某分布式系统中,主节点可以有多台,可以动态上下线 任意一台客户端都能实时感知到主节点服 ...

  2. 安卓图片Bitmap一些旋转处理

    Bitmap convert(Bitmap a, int width, int height) { int w = a.getWidth(); int h = a.getHeight(); Bitma ...

  3. 安卓高级Fresco图片框架的时候

    Fresco:2015FaceBook推出的 及其强大 支持webp图片格式 和渐进式图片加载 中文文档 使用方法 引入依赖 点击查看具体教程 基本使用步骤 在布局中使用其标签 <com.fac ...

  4. 让你的代码量减少3倍!使用kotlin开发Android(三) 缩短五倍的Java Bean

    回顾一下 哈,没想到你已经坚持不懈看到第三篇了,不错哈~坚持就是胜利. 本文同步自博主的私人博客wing的地方酒馆 在上一篇文章中,我们介绍了扩展函数,这里对上一篇进行一点小小的补充. 还记得text ...

  5. 20160216.CCPP体系详解(0026天)

    程序片段(01):01.MemCpy.c 内容概要:内存拷贝 #include <stdio.h> #include <stdlib.h> #include <memor ...

  6. Swift对象实例方法名混淆的解决

    在Xcode7.x中,比如有以下一个类: class Foo{ func test(v:Int,before:Int)->Int{ return v + 1 } } 我可以直接这么做: let ...

  7. 详解EBS接口开发之应收款处理

    参考实例参考:杜春阳 R12应收模块收款API研究 (一)应收款常用标准表简介 1.1   常用标准表 如下表中列出了与应收款处理相关的表和说明: 表名 说明 其他信息 AR_BATCHES_ALL ...

  8. 详解EBS接口开发之库存事务处理采购接收和退货

    (一)接收&退货常用标准表简介 1.1   常用标准表 如下表中列出了与采购接收&退货导入相关的表和说明: 表名 说明 其他信息 RCV_TRANSACTIONS 采购接收事务表 事务 ...

  9. 在OC代码中创建Swift编写的视图控制器

    背景 近日在和一群朋友做项目,我和另一位同学负责iOS客户端,我是一直使用OC的,而他只会Swift,因此在我们分工协作之后,就需要把代码合在一起,这就牵扯到如何在TabbarController中添 ...

  10. 如何使用《DB 查询分析器》高效地生成旬报货运量数据

    如何使用<DB 查询分析器>高效地生成旬报货运量数据 马根峰                    (广东联合电子服务股份有限公司, 广州 510300) 1      引言   中国本土 ...