Tre*_*kaz 4 java xml dtd xmlstreamreader
我有一些现有的代码可以解析顶级元素名称空间以确定我们正在查看哪种 XML 文件。
XMLEventReader reader = createXMLEventReader(...);
try {
while (reader.hasNext()) {
XMLEvent event = reader.nextEvent();
switch (event.getEventType()) {
case XMLStreamConstants.DTD:
// No particularly useful information here?
//((DTD) event).getDocumentTypeDeclaraion();
break;
case XMLStreamConstants.START_ELEMENT:
formatInfo.qName = ((StartElement) event).getName();
return formatInfo;
default:
break;
}
}
} finally {
reader.close();
}
Run Code Online (Sandbox Code Playgroud)
如果我允许解析器从 Web 加载 DTD,getDocumentTypeDeclaraion()则包含一个巨大的字符串,其中包含的信息比我知道如何处理的信息多,因为它在移交字符串之前将所有相关的 DTD 插入到该字符串中。另一方面,如果我阻止解析器从 Web 加载 DTD(出于显而易见的原因,无论如何这是更好的选择),它只会给我字符串"<!DOCTYPE".
有没有办法取回 DOCTYPE 内的值?
我正在使用 JRE 附带的默认解析器,以防万一。
我知道这是一篇旧帖子,但在我找到你的问题并为我指明了正确的方向之前,我无法在网上找到答案。
这里,通过打开方法给出的值来检索 DTD 的外部未解析实体XMLEvent#getEventType()。
XMLInputFactory factory = XMLInputFactory.newInstance();
factory.setXMLResolver(new XMLResolver() {
@Override
public Object resolveEntity(String publicID, String systemID,
String baseURI, String namespace) throws XMLStreamException {
//return a closed input stream if external entities are not needed
return new InputStream() {
@Override
public int read() throws IOException {
return -1;
}
};
}
});
XMLEventReader reader = factory.createXMLEventReader( . . . );
try {
while(reader.hasNext()) {
XMLEvent event = reader.nextEvent();
switch (event.getEventType()) {
case XMLStreamConstants.DTD:
List<EntityDeclaration> entities = ((DTD)event).getEntities();
if (entities != null) {
for (EntityDeclaration entity : entities)
System.out.println(entity.getName() + " = " + entity.getSystemId());
}
break;
case . . .
}
}
} finally {
reader.close();
}
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
965 次 |
| 最近记录: |