任何人都可以向我解释,如何继续下面的场景?
接收文件(MS docs,ODS,PDF)
通过使用jackrabbit-content-extractors的Apache Tika +内容提取进行公共核心元数据提取
使用Jackrabbit将文档(内容)与元数据一起存储到存储库中?
检索文档+元数据
我对第3点和第4点感兴趣...
详细信息:应用程序以交互方式处理文档(某些分析 - 语言检测,字数统计等等+收集尽可能多的详细信息 - 都柏林核心+解析内容/事件处理),以便将处理结果返回给用户,然后提取的内容和元数据(提取的和自定义的用户元数据)存储到JCR存储库中
感谢任何帮助,谢谢