剖析ifstream打开含中文路径名文件失败的原因

http://blog.csdn.net/yukin_xue/article/details/7543423

最近写程序的时候遇到了使用ifstream打开含中文路径文件时失败的问题，在网上翻了一下，发现这是一个普遍遇到的问题，在很多人的博文中也都给出了一些解决技巧，但大多是转载的东西，很少对这个问题引发的原因有一个清晰、全面的解释。因此，我觉得有必要对该问题引发的原因作一个详细的剖析，希望对遇到同样问题的朋友们能有所帮助。

首先，用一个简单的例子来重现一下我所遇到的问题：

（1）在VS2008的“Property Pages”属性页中，选择“Configuration Properties”-->“General”，可以看到当前使用的字符集是“Multi-Byte Character Set”，也就是说程序中使用的是多字节字符集。

（2）接下来看看ifstream打开txt文件的简单代码：

[cpp] view plain copy

#include "stdafx.h"
#include <fstream>
#include <iostream>
using namespace std;
int _tmain(int argc, _TCHAR* argv[])
{
ifstream infile("d://测试.txt");
if(infile.is_open())
{
cout<<"Open Success!";
}
else
{
cout<<"Open Fail!";
}
return 0;
}

(3)运行结果：输出“Open Fail” (打开文件失败！)

从设置选项中可以看到，工程中使用的字符集可设置为“Multi-Byte Character Set”或“Unicode Character Set”，其中“Multi-Byte Character Set”表示使用ANSI编码方式，“Unicode Character Set”表示使用UNICODE编码方式。

那么这两种编码方式有什么样的区别呢？

（1）传统的计算机使用ANSI编码，在ANSI编码模式下，英文字符都用1个字节表示，而某些其它国家的文字（如汉字、日文），无法用单个字节来表示，ANSI便采用多个字节来表示这些字符（汉字是2个字节）。

（2）UNICODE包含UTF-8、UTF-16、UTF-32等多种编码方案（目前windows一般使用UTF-16）。拿UTF-16来说，规定所有字符都使用2个字节表示（不论英文字母还是汉字），对于超出2个字节范围的字符采用代理（采用4个字节表示）。

UNICODE相比ANSI有很多方面的优势（优势体现在哪？），微软非常提倡使用UNICODE编码方式，在MS较新版本的系统中都是采用UNICODE编码的。因此，即便我们在自己写的程序中使用了ANSI编码，系统会将其转换为UNICODE再对其进行处理。

接下来我们说一下ifstream。在调用ifstream的open方法时，系统内部调用mbstowcs_s进行文件名转换（mbstowcs_s函数的作用是把多字节字符转化为宽字符），需要注意的是，该函数的调用结果依赖于程序的本地化设置（什么是本地化设置？）。而本地化设置可以通过setlocale函数来设置，譬如：setlocale(LC_ALL, "chinese")表示将程序本身的语言设置为中文，而程序启动时默认设置为LC_ALL="C"。在使用mbstowcs_s进行字符串转换时，只有当LC_ALL="chinese"时，含中文的字符串才能正确的转换成其对应的宽字节字符，否则（在LC_ALL="C"时），汉字会被看成2个单字节的字符，然后再转换成宽字节的字符，这样转换的结果显然是错误的！这就是ifstream打开含中文路径的文件失败的原因，因为"d://测试.txt"转换后得到错误的路径，因此文件打不开！

解决方法如下：

   1: /********************************************************************

   2:     created:    2008/05/10

   3:     created:    10:5:2008   23:56

   4:     filename:     k:/sj/fstreamTest/fstreamTest/main.cpp

   5:     file path:    k:/sj/fstreamTest/fstreamTest

   6:     file base:    main

   7:     file ext:    cpp

   8:     author:        Gohan

   9: *********************************************************************/

  10: #include <tchar.h>

  11: #include <fstream>

  12: #include <iostream>

  13: using namespace std;

  14: int main()

  15: {

  16:     /************************************************************************/

  17:     /* 方法1，使用_TEXT()宏定义将字符串常量指定为TCHAR*类型                 */

  18:     /* 如果是我，首选此类型                                                 */

  19:     /************************************************************************/

  20:     fstream file;

  21:     file.open(_TEXT("c://测试//测试文本.txt"));

  22:     cout<<file.rdbuf();

  23:     file.close();

24:

  25:     /************************************************************************/

  26:     /* 方法2，使用STL中的locale类的静态方法指定全局locale                   */

  27:     /* 使用该方法以后,cout可能不能正常输出中文，十分蹊跷                    */

  28:     /* 我发现了勉强解决的方法：不要在还原区域设定前用cout或wcout 输出中文   */

  29:     /* 否则后果就是还原区域设定后无法使用cout wcout输出中文                 */

  30:     /************************************************************************/

  31:     locale::global(locale(""));//将全局区域设为操作系统默认区域

  32:     file.open("c://测试//测试文本2.txt");//可以顺利打开文件了

  33:     locale::global(locale("C"));//还原全局区域设定

  34:     cout<<file.rdbuf();

  35:     file.close();

36:

  37:     /************************************************************************/

  38:     /* 方法3，使用C函数setlocale，不能用cout输出中文的问题解决方法同上      */

  39:     /************************************************************************/

  40:     setlocale(LC_ALL,"Chinese-simplified");//设置中文环境

  41:     file.open("c://测试//测试文本3.txt");//可以顺利打开文件了

  42:     setlocale(LC_ALL,"C");//还原

  43:     cout<<file.rdbuf();

  44:     file.close();

  45: }

参见博客：http://www.cppblog.com/gohan/archive/2008/05/11/49488.html

由于windows提倡使用UNICODE编码，因此，我们在使用VS编写程序的时候，最好也都使用UNICODE字符集。这样有利于避免字符集转换带来的问题，同时，也有利于提高效率（前面提到，windows内部会把ANSI编码转换为UNICODE再处理，这些转换当然也带来了额外的时间消耗）。

在示例的程序中，可以将工程字符集设置为UNICODE，然后将字符串前面加上_T(这样，在字符集已经设置为UNICODE的情况下，该字符串会自动采用宽字符表示)，例如：ifstream infile(_T("d://测试.txt")),便不会有打开文件不成功的问题了。

剖析ifstream打开含中文路径名文件失败的原因的更多相关文章

java中File的delete()方法删除文件失败的原因
java中File的delete()方法删除文件失败的原因学习了:http://hujinfan.iteye.com/blog/1266387 的确是忘记关闭了: 引用原文膜拜一下: 一般来说 ja ...
sublime text2 打开包含中文的文件会自动追加.dump后缀解决办法
用sublime text2 打开.c, .h,.txt等文件会自动追加一个.dump后缀,這样在打开.c,.h等文件时无法正常识别,从而无法正常进行语法着色,网上说是因为安装了GBK Encodin ...
myeclipse 保存含中文的jsp失败，提示内容含有 ISO-8859-1 不支持的字符
就是这货,网上说各种设置首选项编码神马的,但我只是临时学一学jsp,装的myeclipse貌似不全,没有他们说的选项,后来发现了解决方案: 出错是因为我的jsp文件是用于在其他jsp中引入的,所以没有 ...
php ci框架中载入css和js文件失败的原因及解决方法
在将html页面整合到ci框架里面的时候,载入css和js失败. 原因是ci框架是入口的框架对框架中文件的全部请求都须要经过index.php处理完毕,当载入外部的css和js文件的时候要使用ba ...
用adb pull命令从android系统中读取文件失败的原因及解决办法
问题:使用adb pull命令从android系统中读取文件失败.显示:Permission denied 原因:是由于文件权限原因引起. 使用ls -l命令查看android系统中的 ...
解决：R读取含中文excel文件，read.xlsx乱码问题
1.新建testexcel.xlsx文件 2.创建R文件:test.R # 定义文件变量 excel_path <- "chapter2/testexcel.xlsx" # ...
转！！java中File的delete()方法删除文件失败的原因
一般来说 java file.delete失败有以下几个原因 1.看看是否被别的进程引用,手工删除试试(删除不了就是被别的进程占用)2.file是文件夹并且不为空,有别的文件夹或文件, 3.极有可 ...
fopen打开文件失败的问题
fopen打开带中文路径或含中文名称的文件失败. 解决这个问题有两个方法:一是改用_wfopen,这个函数接受两个宽字符类型,函数原型如下: FILE* _wfopen(const wchar_t* ...
Mysql load data infile 命令导入含中文csv源数据文件【错误代码 1300】
[1]Load data infile 命令导入含中文csv源数据文件报错:Invalid utf8 character string: '??֧' (1)问题现象 csv格式文件源数据: 导入SQ ...

随机推荐

Python Unicode与中文处理
转自:http://blog.csdn.net/dao123mao/article/details/5396497 python中的unicode是让人很困惑.比较难以理解的问题,本文力求彻底解决这些 ...
jmeter+ANT+Jekins性能自动生成测试报告脚本（模板），加入：Median TIme、90%、95%、99%、QPS、以及流量显示
<?xml version="1.0"?><xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/T ...
Python-S9-Day115——Flask Web框架基础
01 今日内容概要 02 内容回顾 03 Flask框架:配置文件导入原理 04 Flask框架:配置文件使用 05 Flask框架:路由系统 06 Flask框架:请求和响应相关 07 示例:学生管 ...
IO Streams：对象流
简介正如数据流支持原始数据类型的I / O一样,对象流支持对象的I / O.标准类中的大多数但不是全部都支持对象的序列化.那些实现标记接口Serializable的那些. 对象流类是ObjectIn ...
C# 泛型的入门理解（来自网络）
using System.Collections; class Program { //做个比较 static void Main(string[] args) { //new对象 Cls a1 = ...
编译linux kernel及制作initrd ( by quqi99 )
编译linux kernel及制作initrd ( by quqi99 ) 作者:张华发表于:2013-01-27 ( http://blog.csdn.net/quqi99 ) 运行一个l ...
BZOJ-1043 [HAOI2008]下落的圆盘
几何题... 先把所有圆储存起来,然后对于每个圆我们求得之后放下的圆挡住了的部分,求个并集,并把没被挡到的周长加进答案. #include <cstdlib> #include <c ...
imx6 PCIE使能加载ath9k无线网卡
imx6q配置pcie无线网卡遇到如下问题: imx6q-pcie 1ffc000.pcie: PCI host bridge to bus 0000:00 pci_bus 0000:00: root ...
数组洗牌算法-shuffle
数组洗牌,最近直接的想法是从数组随机取出一个元素,放到另一个数组中,但是这样取出的元素会有重复,必须采取一定的方法保证: 1. 元素不能重复2. 元素被抽取的概率相等,即随机性数组洗牌经典算法有两种 ...
Teleportation(tel)
Teleportation(tel) 题目描述 Zy大帝拥有n个星球,因为距离非常遥远,所以Zy在他所居住的1号星球和他的军事基地霸中所在的2号星球建造了两个传送门,这样从1号星球到2号星球就只需要2 ...

剖析ifstream打开含中文路径名文件失败的原因

剖析ifstream打开含中文路径名文件失败的原因的更多相关文章

随机推荐

热门专题