ans*_*gri 4 java xml xhtml tidy jtidy
我正在尝试用JTidy进行XHTML DOM解析,这似乎是违反直觉的任务.特别是,有一种解析HTML的方法:
Node Tidy.parse(Reader, Writer)
Run Code Online (Sandbox Code Playgroud)
为了获得该节点的<body />,我认为,我应该使用
Node Node.findBody(TagTable)
Run Code Online (Sandbox Code Playgroud)
我应该在哪里获得该TagTable的实例?(构造函数受到保护,我还没有找到工厂来生产它.)
我使用JTidy 8.0-SNAPSHOT.
我发现有更简单的方法来提取身体:
tidy = new Tidy(); tidy.setXHTML(true); tidy.setPrintBodyOnly(true);
然后在Reader-Writer对上使用整洁.
应该是简单的.
归档时间: |
|
查看次数: |
2910 次 |
最近记录: |