使用XML时引用未声明的实体异常

Rob*_*Rob 23 c# xml dtd

我试图设置xmldoc的innerxml但得到异常:引用未声明的实体

XmlDocument xmldoc = new XmlDocument();
string text = "Hello, I am text α   – —"
xmldoc.InnerXml = "<p>" + text + "</p>";
Run Code Online (Sandbox Code Playgroud)

这引发了异常:

引用未声明的实体'alpha'.2号线,2号线..

我该如何解决这个问题?

Ste*_*rcq 26

与HTML不同,XML不定义实体(即对UNICODE字符的命名引用),因此α &MDASH; 等不会转换为相应的字符.您必须使用数值.你只能使用< 和& 在XML中

如果要创建HTML,请改用HtmlDocument.

  • HtmlDocument来自System.Windows.Forms命名空间http://j.mp/pSmv82如果您不喜欢它与WebBrowser控件的紧密关联或者导致应用程序出现问题,则可以通过HTML Agility获得纯HTML解析器包http://htmlagilitypack.codeplex.com/wikipage?title=Examples (2认同)

Lan*_*tly 13

在.Net中,您可以使用以下System.Xml.XmlConvert类:

string text = XmlConvert.EncodeName("Hello &alpha;");
Run Code Online (Sandbox Code Playgroud)

或者,您可以通过在DOCTYPE声明中将方括号之间的声明放在本地来声明实体.将以下标头添加到xml:

<!DOCTYPE documentElement[
<!ENTITY Alpha "&#913;">
<!ENTITY ndash "&#8211;">
<!ENTITY mdash "&#8212;">
]>
Run Code Online (Sandbox Code Playgroud)

在"html字符实体"上为实体定义做一个google.


Fer*_*lez 6

前面的答案是对的.另一种方法是将您的html文档链接到定义了这些字符实体的DTD,这是标准的XHTML DTD定义.您的xml文件应包含以下声明:

 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
            "http://www.w3.org/TR/html4/strict.dtd">
Run Code Online (Sandbox Code Playgroud)