fstream中文路径

fstream中文路径在C++的标准库中,std::fstream是个挺好用的文件读写流,操作文件很方便,因为是C++标准库,所以没有其它的环境依赖。在使用fstream过程中,有个打开中文路径文件会失败的问题,自己的代码中一直没处理好,这几天终于有点闲心,把这里改透。涉及很多知识点,也是个遗留已久的问题,特此做个记录。在最后用了个一劳永逸的解决此问题方法:将fstream、FILE再包装下。中文路径使用fstream调试程序过程中,发现打开含中文路径的文件时,会打开失败。查了一些资料,说在VS2008、vs200..

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

目录

中文路径

编译器

统一字符集

修正方法

改全局的Locale

使用wstring

字符集改为宽字符集

升级编译器

一劳永逸

将fstream再包装

总结


在C++的标准库中,std::fstream是个挺好用的文件读写流,操作文件很方便,因为是C++标准库,所以没有其它的环境依赖。在使用fstream过程中,有个打开中文路径文件会失败的问题,自己的代码中一直没处理好,这几天终于有点闲心,把这里改透。涉及很多知识点,也是个遗留已久的问题,特此做个记录。

在最后用了个一劳永逸的解决此问题方法:将fstream、FILE再包装下。

1.中文路径

使用fstream调试程序过程中,发现打开含中文路径的文件时,会打开失败。查了一些资料,说在VS2008、vs2005中,fstream的open函数中,会判断当前的全局编码环境,导致含中文的路径打开失败,也提到了很多修改方法,如让修改全局的Locale改为宽字符、使用宽字符集wstring。

我当时的修改方法是调用重载的open(wstring),即将string的路径,转为wstring,然后fstream就可以打开有中文路径文件了,缺点是在string转wstring时需要调用windows的函数,产生了一个外部依赖,且多了几行代码。

编译器

我所使用的开发环境是vs2008,有些文章说只在vs2005、vs2008的环境中才有这个问题,好在我的开发环境中有vs2015,所以在vs2015中也测试下。很容易执行这个测试,vs2015中执行新建win32控制台程序,在main函数中添加测试代码,定义fstream打开文件,重点是文件路径要有中文。

测试代码如下:

#include <fstream>

int main()

{

    std::fstream st;

    st.open(“D:/temp/fstream测试/测试1.log”, std::fstream::app); //含中文的

    printf(“%s\r\n”, (st.is_open() ? “sucess” : “failed”));

    system(“pause”);

    return 0;

}

测试执行比对后,确认在vs2008中不能打开中文路径文件,而在2015中可以打开中文路径文件,显然这个问题和编译器是有关系的。我想linux环境中会怎么样,还需要测试下Gcc的现象、版本支持情况。在C++标准库中,不约定std::fstream的字符集支持与否的,这个问题肯定和编译器有关。

测试项目的属性界面中,字符集都是默认设置的“使用Unicode字符集”,对比也是有效的。

统一字符集

程序运行的操作系统环境有字符集、程序源码文件有字符集、程序运行后处理字符也有字符集,改字符集是个繁琐的事情,源码文件、软件环境、都需要改。

避免字符集的问题,最简单就是统一字符集,各个涉及字符集的地方都统一,我们写的程序就适应环境的字符集,此时问题就出现了,对于跨平台的开发,linux和windows差别太大了,会引入很多问题。

2.修正方法

为了在vs2008中使用std::fstream,可供使用的方法也有很多,最后总结罗列下面几种改进方法。

改全局的Locale

改全局的Locale,在调用open前调用setLocale修改为多字符集,open之后再改回来。产品是个多线程的程序,在基础库中修改全局的环境,可能会导致访问异常、崩溃,这不是个好方法。

然而这个只需要一行代码即可,修改最简单。复杂软件系统中不要随意改全局编码,不要这么用。

setlocale(LC_ALL,”Chinese-simplified”);

std::fstream stream;

stream.open(“d:/数据/a.log”);

使用wstring

在fstream的接口方法中,重载有多个open函数,包括传入string、wstring等,实际测试确认调用重载传入wstring的open函数时,可以打开中文路径。

定义一个string转wstring的函数,使用fstream的open函数时,先调用转换为wstring,然后调用open函数。这样引入了一个多字符转宽字符的函数,多几行调用,整体的稳定、可靠是没问题的。

关于string转wstring,不要用C标准库的mbstowcs,该方法不支持中文,调用mbstowcs转换的中文会编程乱码。

#include <Windows.h>

//将string转换成wstring  

inline wstring string2wstring(string str)  

{  

wstring result;  

//获取缓冲区大小,并申请空间,缓冲区大小按字符计算  

int len = MultiByteToWideChar(CP_ACP, 0, str.c_str(), str.size(), NULL, 0);  

TCHAR* buffer = new TCHAR[len + 1];  

//多字节编码转换成宽字节编码  

MultiByteToWideChar(CP_ACP, 0, str.c_str(), str.size(), buffer, len);  

buffer[len] = ‘\0’;             //添加字符串结尾  

//删除缓冲区并返回值  

result.append(buffer);  

delete[] buffer;  

return result;  

}  

字符集改为宽字符集

根源上还是字符集的问题,所有的string都改为wstring。我的软件中,一部分代码在windows vs2008开发、另一部分用的QtCreator开发、目前运行在windows,导致源码文件的默认编码是gb2312,软件运行的默认Locale也是多字符集。

由于有跨平台的考虑,要减少环境的依赖、尽量只调用标准库、少改动代码,所以所有的编码应统一utf8,工程量太大,不太现实,后续再改进。

升级编译器

最简单的方法是升级编译器,不要用vs2008。升级编译器,不是小事,看使用者的习惯,代码会不会有影响。升级编译器、编译环境,还是有些繁琐的。导致产品代码,要对编译器有要求,约定了最低编译器版本。

3.一劳永逸

几种方法中都有缺点,转wstring的方式引入了操作系统的依赖,在我的产品代码中想尽量少依赖,可以用升级编译器的方式,但有几个库是vs2008的,都升级有些繁琐。

想到个简单的、一劳永逸的方法,复用FILE指针、fopen函数可以支持中文路径、各种版本编译器中表现也一致。

将fstream再包装

在fstream的构造函数中,有输入FILE指针,在fstream构造函数传入FILE,所以可以先用fopen函数打开带中文路径的文件,然后构造fstream,之后就正常使用fstream即可。

基于再包装wrap的方法,建立WrapFstream类,封装这几个操作。

  1. 成员变量包括std::fstream、FILE,对外接口主要open函数,在open函数内部用fopen打开FILE指针,然后构造fstream对象,此时不会有中文路径的问题。

bool open(const std::string & fileName, const char * mode){

close();

file = fopen(fileName.c_str(), mode);

if (file != NULL)

{

st = new std::fstream(file);

return st->is_open();

}

return false;

}

  1. 在关闭函数close中,需要释放资源。

void close(){

if (st != NULL){

if (st->is_open())

st->close();

delete st;

st = NULL;

}

if (file != NULL)

fclose(file);

file = NULL;

st = NULL;

}

  1. 然后是对外提供fstream接口方法,直接将fstream返回给调用者,调用者直接使用。
  2. 完整代码:

/**

 * 将fstream再包装

 * 单元测试在CoreTest/test_TSore.cpp

 */

class WrapFstream

{

std::fstream * st;

FILE * file;

public:

MFileStream(){

file = NULL;

st = NULL;

}

~MFileStream(){

close();

}

bool open(const char * fileName, const char * mode){

return this->open(string(fileName), mode);

}

bool open(const std::string & fileName, const char * mode){

       ……………….

}

bool is_open(){

if (st != NULL)

return st->is_open();

return false;

}

void close(){

……….

}

std::fstream * stream(){

return st;

}

std::fstream & obj(){

return (*st);

}

};

总结

vs2008中fstream用string不能打开中文路径,要用wstring.

该问题设计多个知识点。文件编码等,有几个方式不能有效解决

1.该全局的编码setLocate(‘c’). 该方法不可,由于TStore是基础库,整个软件是多线程,所有这个setLocate可能导致多线程的访问异常、崩溃。

2.调用C库函数转换为宽字符串mbstowcs. 该方法不可,不能转换中文,VC的实现中只是在每个字节前插入一个x0。

3.调用系统函数windows的多字符串转宽字符MuilteToWideChar,这个是可行的. 这几年一直这么跑,是windows环境,跨平台需要改下。

4.有个文章说vc2005、vc2008有这个问题,而vc2005之前没有,作者跟着fstream的open函数代码,其中有判断全局环境编码的如果是’C’那么将string.c_str()直接转了(wchar*),然后调用CreateFile,所有不能打开。

5.在vc2015确认无此问题。

6.现在用FILE的fopen先打开,然后传递给fstream,再封装下。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/216555.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 无人机——舵机篇(七)[通俗易懂]

    无人机——舵机篇(七)[通俗易懂]文章目录1.舵机的基本知识2.舵机的组成3.舵机的工作原理1.舵机的基本知识舵机就是一种有输出轴的小传动装置。这个输出轴能够通过向舵机输入一个编码信号而定位到我们指定的角度位置。只要这个编码信号存在于信号输入线上,舵机就将保持输出轴的当前角度位置不变。一旦编码信号改变,输出轴的角度位置也将跟着改变。实际中,舵机被用于控制无人机升降尾翼、方向尾翼等的位置。

  • VMware下安装centos7.8及相关配置

    VMware下安装centos7.8及相关配置第一步:下载centos7.8下载地址:http://mirrors.aliyun.com/centos/7.8.2003/isos/x86_64/版本选择(此处我选择DVD版):CentOS-7-x86_64-DVD-1810.iso标准安装版,一般下载这个就可以了(推荐)CentOS-7-x86_64-NetInstall-1810.iso网络安装镜像CentOS-7-x86_64-Everything-1810.iso对完整版安装盘的软件进行补充,集成所有软件CentO.

  • 24 eve 网络模拟器中的机器桥接到物理网络[通俗易懂]

    24 eve 网络模拟器中的机器桥接到物理网络[通俗易懂]

  • TranslateMessage函数 (转)「建议收藏」

    TranslateMessage函数 (转)「建议收藏」TranslateMessage是用来把虚拟键消息转换为字符消息。由于Windows对所有键盘编码都是采用虚拟键的定义,这样当按键按下时,并不得字符消息,需要键盘映射转换为字符的消息。TranslateMessage函数用于将虚…

  • shell编程if/then备忘

    shell编程if/then备忘一、基础知识”[“是专有命令,而不是普通测试符号(ls/usr/bin/[有结果),和test命令等价,并且是内建命令。bash2.02引入[[…]]扩展测试命令,但是[[是一个关键字,而不是一个命令,Bash把[[$a-lt$b]]看做一个单独的元素,并且返回一个退出状态码((…))和let…结构也能够返回退出状态吗,当他们所测试的算术表达式的结构

  • java递归结束条件_方法递归必须有结束条件

    java递归结束条件_方法递归必须有结束条件需求:希望递归结束后去更新UI界面。那什么时候才是递归结束呢。网上有人去判断一个固定参数,然后结束,简直莫名其妙,这个固定参数居然是随便乱取的,不科学。思路:根据判断i=0,收集size的值。通过i=0,收集到循环的长度,因为每个循环都有i=0的时候,而且都只有唯一一个,根据num能收集到循环总长度。代码:for(inti=0;i<((List)data).size()

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号