为什么 `std::basic_ifstream<char16_t>` 在 C++11 中不起作用?

kan*_*yin 2 c++ unicode wchar-t c++11 char16-t

以下代码按预期工作。源代码,文件“file.txt”和“out.txt”都是用utf8编码的。但是,当我改变它不工作wchar_t,以char16_t在第一线main()。我已经尝试过 gcc5.4 和 clang8.0 与-std=c++11. 我的目标是替换wchar_tchar16_t, aswchar_t在 RAM 中占用两倍的空间。我认为这两种类型在 c++11 和更高版本的标准中同样得到很好的支持。我在这里想念什么?

#include<iostream>
#include<fstream>
#include<locale>
#include<codecvt>
#include<string>

int main(){
  typedef wchar_t my_char;

  std::locale::global(std::locale("en_US.UTF-8"));

  std::ofstream out("file.txt");
  out << "123?????abc" << std::endl;
  out.close();

  std::basic_ifstream<my_char> win("file.txt");
  std::basic_string<my_char> wstr;
  win >> wstr;
  win.close();

  std::ifstream in("file.txt");
  std::string str;
  in >> str;
  in.close();

  std::wstring_convert<std::codecvt_utf8<my_char>, my_char> my_char_conv;
  std::basic_string<my_char> conv = my_char_conv.from_bytes(str);

  std::cout << (wstr == conv ? "true" : "false") << std::endl;

  std::basic_ofstream<my_char> wout("out.txt");
  wout << wstr << std::endl << conv << std::endl;
  wout.close();

  return 0;
}
Run Code Online (Sandbox Code Playgroud)

编辑

修改后的代码不能用 clang8.0 编译。它使用 gcc5.4 编译,但在运行时崩溃,如@Brian 所示。

Die*_*ühl 6

各种流类需要一组定义才能操作。标准库只需要相关的定义和对象charwchar_t但不需要char16_tchar32_t。在我的头顶上,需要使用std::basic_ifstream<cT>or std::basic_ofstream<cT>

  1. std::char_traits<cT>指定字符类型的行为方式。我认为这个模板专门用于char16_tchar32_t
  2. usedstd::locale需要包含一个std::num_put<cT>facet的实例来格式化数字类型。这个方面可以被实例化,并且std::locale可以创建一个包含它的新方面,但标准并不强制要求它存在于std::locale对象中。
  3. usedstd::locale需要包含一个 facet 的实例std::num_get<cT>来读取数字类型。同样,这个方面可以被实例化,但默认情况下不需要存在。
  4. facetstd::numpunct<cT>需要专门化并放入 usedstd::locale来处理小数点、千位分隔符和文本布尔值。即使它没有被真正使用,它也会从数字格式和解析函数中引用。没有现成的char16_t或专业化char32_t
  5. 该facetstd::ctype<cT>需要专门化并放入used facet中,以支持字符类型的加宽、缩小和分类。没有现成的char16_t或专业化char32_t
    1. facetstd::codecvt<cT, char, std::mbstate_t>需要专门化并放入用于std::locale在外部字节序列和内部“字符”序列之间进行转换。没有现成的char16_t或专业化char32_t

大多数方面都相当容易做到:它们只需要转发一个简单的转换或进行表查找。然而,std::codecvtfacet 往往相当棘手,特别是因为std::mbstate_t从标准 C++ 库的角度来看它是一种不透明的类型。

所有这些都可以做到。自从我上次对字符类型进行概念实现证明已经有一段时间了。我花了大约一天的时间工作。当然,当我开始工作时,我已经实现了语言环境和 IOStreams 库,我知道我需要做什么。添加合理数量的测试而不是仅仅进行简单的演示可能需要我一周左右的时间(假设我实际上可以专注于这项工作)。