XPath translate() 函数和（分解）组合的 Unicode 字符

was*_*ien 0 xslt xpath

采用以下 XSLT 代码：

\n

<?xml version="1.0" encoding="UTF-8"?>\n<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"\n    version="2.0">\n    <xsl:output method="text"/>\n    <xsl:template match="/">\n        <xsl:value-of select="translate('abc', 'e\xcc\x81abc', 'eabc')"/>  <!--0x65CC81-->\n        <xsl:value-of select="'&#10;'"/>\n        <xsl:value-of select="translate('abc', '\xc3\xa9abc', 'eabc')"/>  <!--0xC3A9-->\n    </xsl:template>\n</xsl:stylesheet>\n

Run Code Online (Sandbox Code Playgroud)\n

使用 Saxon 10 运行此命令会返回：

\n

bc\nabc\n

Run Code Online (Sandbox Code Playgroud)\n

翻译函数的第一次调用使用 \xc3\xa9 的分解形式（U+0065 和 U+0301），而第二次调用则使用 U+00E9。看来他们并没有受到平等的对待。这是可以预料的吗？这种行为是否在某处指定？

\n

请参阅https://www.w3.org/TR/xpath-functions-31/#character-terminology \xc2\xa71.7.1，其中指出：

\n

\n
除非明确说明，否则本文档中的函数返回的 xs:string 值并未在[万维网字符模型 1.0：基础知识] 意义上进行标准化。
\n

\n

因此，translate() 函数将 Unicode 代码点作为输入，并生成 Unicode 代码点作为输出，并且不关心这些代码点是表示组合字符还是分解字符。如果您想要标准化，则必须使用该normalize-unicode()函数显式调用它。

\n

（上面的引用对我来说有点模糊。“未标准化”意味着“没有采取任何行动来标准化字符串”，并不意味着“字符串不会采用标准化形式”。）

\n

归档时间：	3 年，5 月前
查看次数：	179 次
最近记录：	3 年，5 月前

Python Selenium - 获取 href 值 28

用于XSLT样式表的IDE 11

乘以2个数字然后求和 10

在XSLT中调用Java实例方法 7

使用XML包将TCX导入R中 5

XPath当两个属性名称相同时,从当前节点值中选择节点 4

更改Xml声明,或选择不带声明的xml部分 4

如何将xslt模板应用于字符串？ 3

Scrapy - 如何将字符串转换为我可以使用 XPath 的对象？ 2

如何使用saxon加载多个xml文件 0

Python中追加与扩展列表方法的区别 3119

如何在特定索引(JavaScript)的数组中插入项？ 2709

如何在不重新加载页面的情况下修改URL？ 2221

原子和非原子属性之间有什么区别？ 1828

如何从列表中随机选择一个项目？ 1656

@classmethod和@staticmethod对初学者的意义？ 1532

如何使用自定义对象对NSMutableArray进行排序？ 1253

performSelector可能导致泄漏,因为其选择器未知 1251

UTF-8一路走来 1146

如何撤消git reset --hard HEAD~1？ 1083