我的目标是从网页中提取结构化数据.我正在使用这个SO问题中提到的代码.我在Spring项目中使用Apache Any23 CLI库依赖项.
通过使用它,我能够从网页中提取HTML5微数据(Schema.org).但是,我无法提取网页中存在的JSON-LD格式.当我检查Apache Any23的文档时,它支持JSON-LD格式.没有找到任何进一步的文件.
java extract json-ld any23
any23 ×1
extract ×1
java ×1
json-ld ×1