如何去除Word中奇怪的空格符号

Ale*_*xan 9 symbols characters whitespace microsoft-word

我从一个人那里得到了用俄语写的 Word 文件并将它们转换为 HTML。

这些文件包含一些奇怪的空白字符,例如:

在此处输入图片说明

这看起来像小零(我更改了模式以显示特殊字符)。在隐藏模式下,它只是空间。

将文件转换为 HTML 时这些字符看起来很难看的问题。

我需要删除它们。但是如果我搜索它们,我无法将它们与使用空间(看起来像点)区分开来,所以我手动扫描所有文件以查找并删除它们。

那么,我如何找到并删除这些特殊符号?

Nia*_*sky 13

该符号称为不间断空格 (NBSP),并且在 Unicode 中U+00A0(正如您正确指出的那样,与常规空格不同,即 Unicode U+0020)。

当您希望两个单词之间有空格,但不希望 Word(或任何其他支持它们的文本编辑器)在那里放置换行符或换行符时,将使用不间断空格。例如,如果您想编写句子“此计算机支持 Microsoft Windows”,它们会很有用。“Microsoft”和“Windows”之间没有换行符。

至于在 Word 文档中看到它们的问题,很容易解决。您需要做的就是将 NBSP 和示例复制粘贴到查找和替换的搜索部分,然后在替换部分中键入一个常规空格。这应该可以解决您的问题。


如果您好奇,可以在 Wikipedia上找到有关 NBSP 的更多信息。然而,当 HTML 将任意数量的连续常规空格视为一个空格时,它会特别处理 NBSP(您可能已经看到它在 HTML 输出中表示为 )。这是为了让用户可以在 CSS 不适合的情况下(或者如果您只是想要快速而肮脏的 hack :))对间距进行更细粒度的控制。因此,您可能会发现 NBSP 最终在 HTML 中确实派上用场——但是,它们肯定会弄乱您的 HTML 源代码,并且在不需要时会很烦人。

您可能还想知道如何自己在 Word 中插入 NBSP - 无需一直从 Wikipedia 复制粘贴。您可以从“插入符号”对话框(插入选项卡 > 符号 > 特殊字符选项卡 > 不间断空格)插入它们。您也可以使用快捷键Ctrl+ Shift+ Space。在“查找和替换”对话框中,您还可以通过More >>依次单击、Special下拉菜单和来插入它们Nonbreaking space