Tra*_*han 17 c++ string utf-8 wstring
我需要在wstring和string之间进行转换.我想,使用codecvt facet应该可以解决问题,但它似乎不适用于utf-8语言环境.
我的想法是,当我将utf-8编码文件读取到字符时,一个utf-8字符被读入两个普通字符(这就是utf-8的工作原理).我想从我的代码中使用的库的wstring表示创建这个utf-8字符串.
有谁知道怎么做?
我已经尝试过了:
locale mylocale("cs_CZ.utf-8");
mbstate_t mystate;
wstring mywstring = L"??žýáí";
const codecvt<wchar_t,char,mbstate_t>& myfacet =
use_facet<codecvt<wchar_t,char,mbstate_t> >(mylocale);
codecvt<wchar_t,char,mbstate_t>::result myresult;
size_t length = mywstring.length();
char* pstr= new char [length+1];
const wchar_t* pwc;
char* pc;
// translate characters:
myresult = myfacet.out (mystate,
mywstring.c_str(), mywstring.c_str()+length+1, pwc,
pstr, pstr+length+1, pc);
if ( myresult == codecvt<wchar_t,char,mbstate_t>::ok )
cout << "Translation successful: " << pstr << endl;
else cout << "failed" << endl;
return 0;
Run Code Online (Sandbox Code Playgroud)
它为cs_CZ.utf-8语言环境返回'failed',并且对cs_CZ.iso8859-2语言环境正常工作.
sky*_*yde 74
下面的代码可能会帮助你:)
#include <codecvt>
#include <string>
// convert UTF-8 string to wstring
std::wstring utf8_to_wstring (const std::string& str)
{
std::wstring_convert<std::codecvt_utf8<wchar_t>> myconv;
return myconv.from_bytes(str);
}
// convert wstring to UTF-8 string
std::string wstring_to_utf8 (const std::wstring& str)
{
std::wstring_convert<std::codecvt_utf8<wchar_t>> myconv;
return myconv.to_bytes(str);
}
Run Code Online (Sandbox Code Playgroud)
你的平台是什么?请注意,Windows 不支持 UTF-8 语言环境,因此这可以解释您失败的原因。
要以依赖于平台的方式完成此操作,您可以在 Windows 上使用MultiByteToWideChar / WideCharToMultiByte,在 Linux上使用iconv。您也许可以使用一些 boost 魔法以独立于平台的方式完成此操作,但我自己还没有尝试过,因此我无法添加此选项。
Phi*_*ipp -11
C++ 不知道 Unicode。使用外部库,例如 ICU ( UnicodeStringclass ) 或 Qt ( QStringclass ),两者都支持 Unicode,包括 UTF-8。