提取包含在openrefine中的字符串的html标签?

tre*_*kec 5 html openrefine

标题中没有太多添加。这就是我想要做的。有什么建议么?

我在github上查看了文档,并在Google上进行了广泛的搜索。

我最好的是:

value.parseHtml().select('p[contains('xyz')]')
Run Code Online (Sandbox Code Playgroud)

这会导致语法错误。

Owe*_*ens 3

“select”语法基于 Beautiful Soup 中的 select 语法 ( http://jsoup.org/cookbook/extracting-data/selector-syntax )

在这种情况下,我相信您需要的语法是:

value.parseHtml().select("p:contains(xyz)")
Run Code Online (Sandbox Code Playgroud)

欧文