是否适合使用非ASCII(自然语言)XML标记?

Vla*_*iev 8 xml internationalization

是否适合使用以非ASCII自然语言编写的XML标记(元素名称)?XML规范允许它(参见名称例外),但我在W3C和相关页面上找不到任何关于此的最佳实践.

我正在寻找的是关于哪些工具支持这一点的实用建议,是否重要的​​XML相关技术(如XSLT和XForms)可能存在问题等.

我认为安德烈和托马拉克错过了这一点.XML不一定是程序员阅读的,它由许多不同的专业人士阅读.因此,将其与源代码进行比较的论据不一定适用.

让我澄清一下:我指的是一个保加利亚法律领域,其中许多条款是保加利亚法律程序特有的,甚至可能没有确切的英文翻译.翻译它们将是费力的,不精确的和不切实际的.音译到ASCII是次优的.

回到这个问题:我将面临哪些工具限制?(Eclipse支持UTF,因此编写xpaths不会有问题.)

让人们从我想要的技术方向开始:在几个系统中,我们使用生成技术来确保XML模式,Java bean和数据库模式之间的完美对应.

Mat*_*w S 5

如果文件的内容是保加利亚语,那么标记应该是可以的.

如果您的工具链无法解析该语言的标签,那么您如何确定它正确处理内容?

程序员将始终必须学习目标领域的语言,无论是金融,遗传,工程还是保加利亚法律体系.为方便程序员而破坏可用性几乎总是"坏事".无论在前端节省了多少精力,都会因为最终用户的生产力受阻以及产品生命周期内的支持工作量/成本而丢失.


Tom*_*lak 2

简短回答:您可以按照自己喜欢的方式命名 XML 元素。

稍微长一点的答案:如果您想使用最可移植/可维护的 XML,您可能应该使用纯 ASCII 元素名称。我想不出在元素名称中使用其他字符的充分理由,而且它确实有助于在各种地方处理 XML。

考虑使用某种编程语言处理 XML 节点,该语言不一定具有 UTF-8 编码的源代码文件。例如,用这样的语言编写有效的 XPath 表达式会很困难。或者不使用元素名称所用语言但负责源代码的维护人员/程序员。例如,当元素名称采用西里尔字母时,您就有点将自己锁定了。元素名称应包含结构和含义,并且没有明显的理由排除 ASCII 用于此目的。