这与问题有些相关
在 Windows 7 上,dir 或 tree 无法显示 unicode 字符,即使以 cmd /U 启动 cmd
即使在 Windows 7 上,我发现让 unicode 进入文件的唯一方法是通过
> cmd /U
> dir /B > files.txt
Run Code Online (Sandbox Code Playgroud)
当我在记事本中打开并尝试“另存为”时,该文件将采用“Unicode”格式,如果我dir /B > files.html在 firefox 中打开 HTML 文件,它可以使用 UTF-16(或 UTF-16 LE)编码显示。
但是,如果我想在屏幕上看到它而不是让它转到文件,那仍然是不可能的。有没有办法让它发生?可能以某种方式告诉 cmd 不要将不可打印的字符显示为“?”
更新:我在 Windows 上尝试了 cmd.exe、cygwin 的 bash 和 PowerShell。他们是一样的。除非我将“属性 - > 字体”更改为 Consolas 或 Lucida Console,否则会有一些改进——现在它不是问号,而是方形边框或带有问号的方形。
带有 Mac OS X 的更昂贵的 Mac 计算机可以做到。免费的 Ubuntu 也可以做到。
如何将本文档中的这张长词汇表(一列希腊语,一列英语)转换为一个保留希腊字符的 Excel 电子表格?每当我尝试复制粘贴时,我都会得到如下结果:
ajgaqov", ajgaqhv, ajgaqovn
如何让 Windows 7 正确显示 Unicode 所有字符,就像这个问题中的那些?
现在我只看到其中一些的方块。
在 Facebook 上,目前有一些带有这些奇怪字符的消息:
???????????????????????? ???????????????????????? ????????????????????????
它们用于混淆读者,因为它们超出了指定的文本区域。
它们真的属于一种语言吗?如果有,是哪一个?
我有一个包含一些 Unicode 字符的 PDF 文件(见图)。

我可以将这些字符复制到剪贴板并插入到例如 MS Word 中,我将字符视为一个带有问号的正方形,这可能是因为我的系统中缺少相应的字体。
我想要的是获取 UTF 中的字符代码及其名称。我怎样才能得到它们?这是我感兴趣的字符——也许人们可以直接识别它们?无论如何,PDF 和 Unicode 的通用解决方案会很棒。
今天是个好日子,
七周前,我开始学习 Vim。我过去尝试过很多次,但这次不像过去的每一次。我明白了,Vim 成了我戒不掉的习惯。我什至写了我的 vimrc,我不敢相信我生活在一个我曾经使用美化记事本的时代。我绝不是专家或中级 Vimmer。我只是一个想在日常编程生活中继续使用 Vim 的菜鸟。这听起来比务实更浪漫,但这是事实。
本周,我需要编辑包含非英语语言的文件。它是阿拉伯语,但问题也适用于希伯来语和波斯语(波斯语)。令我震惊的是,Vim 不支持双向文本。(不太好)的解决方案是有两个标签,一个从左到右,另一个从右到左,但在我看来这很丑陋。我机器上唯一不支持双向文本的edit编辑器是(Windows 中的命令行编辑器!)。
有没有解决方案,或者我应该回到 Notepad++ 而忘记 Vim?
我发现很难在 Notepad++ 和 Vim 之间切换,因为我编辑了很多包含双向文本的文件。
谢谢大家,
我正在尝试将电子表格保存为 CSV 文件。该文件由韩文字符组成,生成的 csv 将这些字符从字面上转换为问号 (0x3F)。
我在英文版的 Windows 上运行,但我(应该)安装了适当的字符集。非 unicode 程序的默认编码是英语。我以其他格式(例如,xls 或 txt)保存文件没有问题。
日语和中文字符也会出现此问题。
我使用的示例字符串(在单独的文件中)是
?????
??
????
Run Code Online (Sandbox Code Playgroud)
没有文件正确导出。
保存为 CSV 时,Excel 是否支持亚洲字符?
更新
决定做一些测试。我没有尝试从 xls 导出到 csv,而是手动创建了一个包含以下中文字符的 csv:??. 我正在使用 Notepad++ 来保存文件。这样做的目的是为了测试excel是否真的可以正确保存某些字符的CSV文件。
首先,我用 UTF8 编码文件,没有带.csv扩展名的BOM 。我在 Excel 中打开了该文件,它将字符呈现为 ASCII(因此,不正确。看起来像ä½ å¥½)。但是,当我保存文件时,当我在记事本++中以UTF8打开它时,字符被保留了下来。
其次,我创建了测试文件的新副本,但这次将其编码为 UTF8(带有 BOM)。我在 Excel 中打开了文件,它正确读取了文件(如??)。然后我重新保存了文件,但这次它将字符转换为两个问号。
我发现有趣的是,虽然 Excel 正确读取了文件,但它无法正确地重新保存它,但是当它读取为 ASCII 时,它不会尝试转换它们,而是按原样输出它们。Excel 尝试保存 unicode 字符时似乎存在问题?
解决方法
我将文档保存为Unicode Text生成制表符分隔的文本文件,并保留了亚洲字符。应该有工具可以将制表符分隔的文件转换为逗号分隔的文件。
因为文件是 unicode 编码的,所以我在顶部显示的所有示例字符串(来自三个不同的字符集)都正确显示。
我有一个带有奇怪字符的注册表项:
"C:\Program Files (x86)\Google\Desktop\Install\{a33ad396-dacb-512c-46ab-10675be7c6b5}\ \...\???\{a33ad396-dacb-512c-46ab-10675be7c6b5}\GoogleUpdate.exe" <
"C:\Users\Bart\AppData\Local\Google\Desktop\Install\{a33ad396-dacb-512c-46ab-10675be7c6b5}\dxÙ\" h\.ù[\{a33ad396-dacb-512c-46ab-10675be7c6b5}\GoogleUpdate.exe" >
C:\Users\Bart\AppData\Local\Google\Desktop\Install\{a33ad396-dacb-512c-46ab-10675be7c6b5}\???\???\???\{a33ad396-dacb-512c-46ab-10675be7c6b5}\L
Run Code Online (Sandbox Code Playgroud)
都是关于这两个角色的:???
(尝试将其复制到记事本,看看会发生什么)
您在该角色后面键入的所有内容都是从右到左的。
Regedit 无法读取此值并给出此错误:error reading the value's contents当您打开Run子项时。这就是我根本无法删除此条目的原因。
我几乎可以肯定它是 ZeroAccess 恶意软件。
这里发生了什么?
我在word文档中写了副标题并将其保存为UTF-8编码的txt文件。然后我手动将其格式从txt更改为srt。我的字幕语言是波斯语。
我把它放在同名电影的同一个文件夹中。播放电影时,一切正常,但播放电影时字幕中键入的数字显示为英文,而不是波斯语。有什么建议吗?
