如何使用Unicode显示空白字符进行调试/编辑

CJ *_*nis 9 html unicode whitespace

我希望在调试或编辑文本时显示空格字符,方法是将它们替换为合理的Unicode代码点,并将它们着色为灰色而不是黑色.

例如,我想替换

  • SPACE U+0020MIDDLE DOT·U+00B7
  • NO-BREAK SPACE U+00A0MEDIUM SMALL WHITE CIRCLEU+26AC
  • RIGHTWARDS ARROWU+2192TAB U+0009.
  • 等等...

我正在寻找合理的字形:

  • CARRIAGE RETURN U+000D
  • newline/LINE FEED U+000A.

我不想使用PILCROW SIGN,U+00B6因为它不直观地对应于任何一个,而是新段落的概念.还有DOWNWARDS ARROW WITH CORNER LEFTWARDSU+21B5但是,它似乎更像是一个组合符号,而不是单独代表任何一个.

当我有混合行结尾时,我希望能够看到正在使用哪个字符(或两者).我在浏览器中以HTML格式显示输出.

目前我想不出更好的符号而不是: - LEFTWARDS ARROWU+2190for carriage return - DOWNWARDS ARROWU+2193for newline.

我知道SYMBOL为CARRIAGE RETURNU+240D,象征LINE FEEDU+240ASYMBOL FOR NEWLINEU+2424但细节是很难看到他们.

我也不想使用\r,并\n有两个原因,r并且n看起来有些相似(虽然不多,但一点点),它需要两个字符,而不是显示一个他们.但是,如果我没有得到任何更好的建议,我可以选择使用DOWNWARDS ARROW WITH CORNER LEFTWARDSU+21B5进行回车,使用RIGHTWARDS ARROW WITH CORNER DOWNWARDSU+21B4进行换行.

G_H*_*G_H 4

正如您所说,U+21B5(\xe2\x86\xb5) 是回车的不错选择。请注意,它是回车键上的符号,自电动打字机时代以来就一直在使用。这也是这个名字的由来,因为它实际上会返回固定纸张的托架并将其移动到色带头下方。因此,我认为它已经在键盘用户中根深蒂固,可以直观地识别。

\n\n

然而,由于您已经注意到有关可见性的问题,请考虑U+23CE(\xe2\x8f\x8e)。该符号是 UNICODE 标准的一部分,用于表示返回的明确目的;但它通常可以被解释为换行,通常是回车和换行的组合(取决于系统)。

\n\n

U+21B5(\xe2\x86\xb5) 是 UNICODE 箭头块的一部分,而U+23CE(\xe2\x8f\x8e) 是“杂项技术”块的一部分。第二个箭头更接近于对像您这样的技术考虑有用的东西,而不是常规箭头。

\n\n

这样我们就只剩下换行了。当你开始思考它到底是什么时,甚至返回箭头的选择也变得值得怀疑。换行基本上是向下移动一行的指令。回车只是将插入符号(“回车”)移回行首。换行符不必回车符组合,回车符实际上也不必与换行符组合(尽管通常不这样做是没有意义的)。在打字机上,这开始有意义。键入一行后,您将笔架转回到起始位置,然后向上滚动纸张。基本上就是回车+换行。现在您明白了为什么“新线”作为这两者的组合出于历史目的可能有意义,以及为什么它们可以按任一顺序使用。从技术上讲,您可以进行不带回车的换行,并在上一行中断的列中继续输入。这使我们的 \xe2\x86\xb5/\xe2\x8f\x8e 受到质疑的原因是该符号似乎暗示着回车和换行。事实上,在电动打字机和文字处理器上,它通常会产生一个全新的行。

\n\n

那么,如何表示换行呢?向下的箭头似乎是直观的选择,但我们可能还需要重新考虑回车符。U+21E9(向下的白色箭头,\xe2\x87\xa9)在视觉上(可能,考虑到字形可能有所不同)与 \xe2\x8f\x8e 最一致。但如果我们这样做,您也可以使用U+21E6(向左白色箭头,\xe2\x87\xa6)作为回车符。

\n\n

这么多选择该选什么?嗯,我个人认为技术上优越的选择是 UNICODE“控制图片”块中的字符。它们是U+240A用于换行的 (\xe2\x90\x8a) 和U+240D用于回车的 (\xe2\x90\x8d)。它们也吸引了我这样的程序员,因为它们的代码点的最后一个字节对应于它们的 ASCII 代码。但我知道它们在屏幕上很难辨认,可用性可能更重要。但是,当要求显示所有符号时,许多文本编辑器都会采用一些变体。

\n\n

所以我想说的选项是......

\n\n
    \n
  • \xe2\x90\x8a 和 \xe2\x90\x8d 在技术上是最正确的。
  • \n
  • \xe2\x87\xa9 和 \xe2\x87\xa6 以获得最清晰的视觉效果,位于同一代码块中,并且在给定字体的表示中可能保持一致。
  • \n
  • \xe2\x86\xb5 或 \xe2\x8f\x8e 作为最容易识别的回车符,然后是换行的其他选项;但这也可能是最令人困惑的,因为有角度的箭头实际上意味着回车+换行。
  • \n
\n\n

还要确保您选择的内容可能在大多数浏览器中正确显示,并且在不同的浏览器和系统上具有不同的默认字体。我注意到当我浏览 UTF-8 表时,补充块的一些代码点没有显示。

\n\n

最后,说一句。是否必须使用UNICODE符号?Notepad++,我最喜欢的文本编辑器,当所有符号都可视化时,它在灰色背景上使用大“CR”和“LF”符号。也许您可以简单地使用图像(最好根据 CSS 中的字体大小进行缩放)?

\n