我无法找到任何限制文本中允许使用哪些字符这是否意味着允许删除或者是否存在影响HTML文档的限制?
例如,字符引用部分声明:
允许使用数字字符引用表单引用U + 0000,U + 000D以外的任何Unicode代码点,永久未定义的Unicode字符(非字符),代理(U + D800-U + DFFF)和控制字符除了空格字符.
这些字符是否仍然允许在文本中以"未转义"形式出现?例如,作为属性值:<span title="Hello ? World"></span>其中␀是U + 0000 NULL字符(不是 U + 2400).
页面上和标记中文本的字符限制是根据您选择的字符集定义的。如果您没有定义字符集,浏览器将进行猜测或断言其默认选项(通常是限制最少的选项)。字符集是通过使用文档部分中带有属性的meta标签来定义的。最常见的示例使用UTF-8字符集:charsethead
<meta charset="UTF-8" />
Run Code Online (Sandbox Code Playgroud)
该属性的值可以是Internet 号码分配机构 (IANA)定义的任何字符集。已定义字符集的完整列表可在此处找到。
此外,对于某些元素(或元素类型)中使用的未转义文本可能存在特定限制。在这种情况下,您必须阅读该标签或标签类型的规范,或者简单地通过将有问题的字符替换为与号编码的 html 实体转义值来转义它们。
| 归档时间: |
|
| 查看次数: |
115 次 |
| 最近记录: |