cls*_*udt 10 markdown escaping diacritics multimarkdown
我刚刚发现了Markdown和MultiMarkdown,到目前为止我很喜欢它.但是,在导出到HTML时,特殊字符未正确转义,并在浏览器中显示为垃圾.
例:
How does Markdown handle special characters?
============================================
For example, German is full of ä, ö, ü and ß.
Run Code Online (Sandbox Code Playgroud)
转换为
<h1 id="howdoesmarkdownhandlespecialcharacters">How does Markdown handle special characters?</h1>
<p>For example, German is full of ä, ö, ü and ß.</p>
Run Code Online (Sandbox Code Playgroud)
因为我必须用德语写很多东西,所以不能选择手工输入转义序列.如何使用正确转义的特殊字符获取HTML输出?
据我所知,这是不可能的(尽管我很乐意被证明是错误的)。我最近一直在使用 Markdown 语法在 Doxygen 中生成文档,并且不得不用 替换所有 ° 符号°,这是一种耻辱,因为它违背了 Markdown 的理念,即使文本文件与生成的输出一样可读。
我不知道这种情况是否适用于你,但这里有:
我对挪威字母 'æ'、'ø' 和 'å' 也有同样的需求。我使用 FireFox 和附加组件“Markdown Viewer”来查看 Markdown 文档。
如果文档以普通方式保存,在 Markdown Viewer 中查看挪威语文档会呈现乱码。
使用西方(windows 1252)编码保存文档可以很好地呈现文本(我也尝试过使用您的德语字母)。
你想要的是告诉浏览器使用UTF-8编码,在这种情况下那些“特殊”字符将被正确显示。<meta charset="UTF-8">可以通过在页面部分添加标签来强制执行 UTF-8 <head>。
<!DOCTYPE html>\n<html>\n\n<head>\n<meta charset="UTF-8">\n<title>Title of the document</title>\n</head>\n\n<body>\n<h1 id="howdoesmarkdownhandlespecialcharacters">How does Markdown handle special characters?</h1>\n<p>For example, German is full of \xc3\xa4, \xc3\xb6, \xc3\xbc and \xc3\x9f.</p>\n</body>\n</html>\nRun Code Online (Sandbox Code Playgroud)\n\n字符集信息是
\n\npandoc -o index.html index.md --standaloneindex.md包含 OP\ 的原始 markdown 代码时所做的事情,<meta charset="UTF-8">或者您可以在生成文件后手动输入标签*.html,<meta>或者您使用的 markdown 到 html 转换器可能提供在该部分中注入内容(在我们的例子中为标签)的选项<head>。在这种情况下,将使用akapandoc选项,尽管这是不必要的,因为默认指定 UTF-8 字符集。-H--include-in-headerpandoc