在测试了发现服务后,至少对我来说似乎没用,或者我可能会遗漏一些东西.
当我查询时,它匹配文档并返回整个文档.如果我的文档很大,那么对于所有查询,它返回与查询文本匹配的整个文档,这是无用的.
现在,我是否必须为每个查询创建单独的文档?
如果是这种情况,API.AI或WIT.AI是更好的选择.
请告诉我这里我缺少的东西!
我刚去Bluemix看到有一个名为Discovery的新实验服务.显然,它可以在其他文件类型中提取PDF,Word文档和HTML页面.
该服务与文档转换(DC)之间有什么区别?之前,我曾经使用DC转换我的文档,然后在Retrieve和Rank中将它们编入索引?Discovery是检索和排名与文档转换的合并吗?
有没有办法列出属于某个 Watson Discovery 集合的文档的元数据(如 ID、文件名等)?
有一些 API 方法需要文档 ID(例如“删除文档”),因此显然应该有一种方法可以获取此 ID。但是我无法找到如何做到这一点(既不是通过 UI 也不是通过 API)。