我怎么能cin和cout一些unicode文本?

Nar*_*rek 13 c++ windows unicode console

我问一个代码片段,其中包含一个unicode文本,将另一个unicode one连接到第一个unicode文本,然后将cout连接到结果.

PS此代码将帮助我解决unicode的另一个更大的问题.但在关键是要完成我的要求之前.

ADDED:BTW我在运行可执行文件时无法在命令行中写入任何unicode符号.我应该怎么做?

Bol*_*olo 10

我在过去遇到过类似的问题,在我的情况下imbue也是sync_with_stdio如此.试试这个:

#include <iostream>
#include <locale>
#include <string>

using namespace std;

int main() {
    ios_base::sync_with_stdio(false);
    wcin.imbue(locale("en_US.UTF-8"));
    wcout.imbue(locale("en_US.UTF-8"));

    wstring s;
    wstring t(L" la Polynésie française");

    wcin >> s;
    wcout << s << t << endl;
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

  • `wcin`和`wcout`在Windows上不起作用,就像等效的C函数一样.只有本机API才有效. (3认同)
  • 我已调试,接缝这行是问题所在:wcin.imbue(locale("en_US.UTF-8")); (2认同)

Bri*_*ndy 9

取决于你的意思是什么类型的unicode.我认为你的意思是你只是在和我一起工作std::wstring.在那种情况下使用std::wcinstd::wcout.

对于编码之间的转换,您可以使用您的操作系统功能,例如Win32 : WideCharToMultiByte, MultiByteToWideChar或者您可以使用像libiconv这样的库


Phi*_*ipp 7

下面是一个示例,显示了四种不同的方法,其中只有第三种(C conio)和第四种(本机Windows API)工作(但仅限于stdin/stdout未被重定向).请注意,您仍然需要包含要显示的角色的字体(Lucida Console至少支持希腊语和西里尔语).请注意,这里的所有内容都是完全不可移植的,在终端上没有可移植的方式来输入/输出Unicode字符串.

#ifndef UNICODE
#define UNICODE
#endif

#ifndef _UNICODE
#define _UNICODE
#endif

#define STRICT
#define NOMINMAX
#define WIN32_LEAN_AND_MEAN

#include <iostream>
#include <string>
#include <cstdlib>
#include <cstdio>

#include <conio.h>
#include <windows.h>

void testIostream();
void testStdio();
void testConio();
void testWindows();

int wmain() {
    testIostream();
    testStdio();
    testConio();
    testWindows();
    std::system("pause");
}

void testIostream() {
    std::wstring first, second;
    std::getline(std::wcin, first);
    if (!std::wcin.good()) return;
    std::getline(std::wcin, second);
    if (!std::wcin.good()) return;
    std::wcout << first << second << std::endl;
}

void testStdio() {
    wchar_t buffer[0x1000];
    if (!_getws_s(buffer)) return;
    const std::wstring first = buffer;
    if (!_getws_s(buffer)) return;
    const std::wstring second = buffer;
    const std::wstring result = first + second;
    _putws(result.c_str());
}

void testConio() {
    wchar_t buffer[0x1000];
    std::size_t numRead = 0;
    if (_cgetws_s(buffer, &numRead)) return;
    const std::wstring first(buffer, numRead);
    if (_cgetws_s(buffer, &numRead)) return;
    const std::wstring second(buffer, numRead);
    const std::wstring result = first + second + L'\n';
    _cputws(result.c_str());
}

void testWindows() {
    const HANDLE stdIn = GetStdHandle(STD_INPUT_HANDLE);
    WCHAR buffer[0x1000];
    DWORD numRead = 0;
    if (!ReadConsoleW(stdIn, buffer, sizeof buffer, &numRead, NULL)) return;
    const std::wstring first(buffer, numRead - 2);
    if (!ReadConsoleW(stdIn, buffer, sizeof buffer, &numRead, NULL)) return;
    const std::wstring second(buffer, numRead);
    const std::wstring result = first + second;
    const HANDLE stdOut = GetStdHandle(STD_OUTPUT_HANDLE);
    DWORD numWritten = 0;
    WriteConsoleW(stdOut, result.c_str(), result.size(), &numWritten, NULL);
}
Run Code Online (Sandbox Code Playgroud)
  • 编辑1:我添加了一个基于的方法conio.
  • 编辑2:我_O_U16TEXT在迈克尔卡普兰的博客中描述了一下,但似乎只是wgets将(8位)数据解释ReadFile为UTF-16.我会在周末进一步调查这一点.