小编bug*_*oft的帖子

如何在Java中更改HTML标记内容?

如何在Java中更改标记的HTML内容?例如:

之前:

<html>
    <head>
    </head>
    <body>
        <div>text<div>**text**</div>text</div>
    </body>
</html>
Run Code Online (Sandbox Code Playgroud)

后:

<html>
    <head>
    </head>
    <body>
        <div>text<div>**new text**</div>text</div>
    </body>
</html>
Run Code Online (Sandbox Code Playgroud)

我尝试了JTidy,但它不支持getTextContent.还有其他解决方案吗?


谢谢,我想解析没有格式良好的HTML.我试过TagSoup,但是当我有这个代码时:

<body>
sometext <div>text</div>
</body>
Run Code Online (Sandbox Code Playgroud)

我希望将"sometext"更改为"someAnotherText",当我使用{bodyNode}.getTextContent()它时,它会给我:"sometext text"; 当我使用setTextContet("someAnotherText"+{bodyNode}.getTextContent())并序列化这些结构时,结果是<body>someAnotherText sometext text</body>,没有<div>标签.这对我来说是个问题.

html java tags jtidy

2
推荐指数
1
解决办法
2万
查看次数

标签 统计

html ×1

java ×1

jtidy ×1

tags ×1