我有一个我仍在开发的AWS CloudSearch实例.
有时,例如当我对字段的格式进行一些修改时,我发现自己想要消除所有数据并重新生成它.
有没有办法使用控制台清除所有数据,或者我必须通过程序方式来解决它?
如果我必须使用编程方法(即生成和POST一堆"删除"SDF文件)有什么好方法可以查询CloudSearch实例中的所有文档吗?
我想我可以删除并重新创建实例,但这需要一段时间,并丢失所有索引/等级表达式/文本选项/等
我试图了解模糊搜索在AWS CloudSearch上的工作原理
我想找到"星球大战",但在我的搜索中,我拼写它
ster wers
Run Code Online (Sandbox Code Playgroud)
我的应用程序的逻辑将增加模糊,但它永远不会返回星球大战.我试过了:
ster~1 wers~1
"ster wers"~2
"ster"~1 "wers"~1
Run Code Online (Sandbox Code Playgroud)
我在这里错过了什么?
我整理了一个简单的搜索表单,搜索框和几个过滤器作为下拉列表.一切都按照您的预期工作,除了我希望行为是当用户将所有内容完全留空(没有搜索查询,没有过滤器)时,他们只是返回所有内容(当然是分页).
我目前通过检测此特例并查询我的本地数据库来实现这一目标,但使用CloudSearch 100%实现这一目标有一些优势.有没有办法构建一个只返回每个文档的分页列表的请求?换句话说,CloudSearch是否相当于"SELECT id FROM x LIMIT n?"
提前致谢!乔
如何phrase
以及term
在不同的Structured
查询?
我的CloudSearch域中有这些数据:
{
"guid": 9,
"operating_systems": [
"12345", "123"
],
"manufacturer": "sealand",
"model": "gaming tree whale plum",
"identifier": "gaming tree whale plum",
"type": "computer",
"created_at": "1982-10-14T14:43:54Z"
}
Run Code Online (Sandbox Code Playgroud)
"model"
是类型text
,"identifier"
是类型literal
,"created_at"
是类型date
.
我们来一些问题:
(phrase field=model 'tree whale') match
(phrase field= identifier 'tree whale') no match
(phrase 'tree whale') match
(phrase field=created_at '1982-10-14T14:43:54Z') match (this shouldn't match according to docs)
(term field=model 'tree whale') match
(term field= identifier …
Run Code Online (Sandbox Code Playgroud) 我有兴趣将AWS Cloud Search用于我的网络应用程序.我有3种不同的文档类型,我想要搜索(用户 - 文章 - 图像).
使用Cloud Search执行此操作的最佳方法是什么?我是否需要创建3个不同的AWS搜索域?这是否意味着我需要支付至少3个搜索实例?
或者我可以将它们全部放在1个域/实例中并使用索引或类型之类的东西(使用弹性搜索术语)?
谢谢!
我想知道 Amazon CloudSearch 和 Kendra 之间的主要区别是什么?为什么同一家公司有两种不同的工具相互竞争?两者看起来都一样,我不确定功能上有什么区别。如何将一个与另一个区分开来?
\nAmazon CloudSearch:为您的网站或应用程序设置、管理和扩展搜索解决方案。Amazon CloudSearch 使您能够搜索大量数据,例如网页、文档文件、论坛帖子或产品信息。只需在 AWS 管理控制台中单击几下,您就可以创建搜索域,将您想要搜索的数据上传到 Amazon CloudSearch,搜索服务会自动配置所需的技术资源并部署高度调整的搜索索引;
\nAmazon Kendra:由机器学习提供支持的企业搜索服务。这是一项高度准确且易于使用的企业搜索服务,\xe2\x80\x99s 由机器学习提供支持。它为您的网站和应用程序提供强大的自然语言搜索功能,以便您的最终用户可以在公司遍布的大量内容中更轻松地找到他们所需的信息。
\n我正在搜索有关ElasticSearch如何根据其索引中的数据量进行扩展的信息,并且我很惊讶我在该主题上找不到多少.也许来自这里的人群的一些经验可以帮助我.
我们目前正在使用CloudSearch索引≈700万个文档; 在CloudSearch中,这会产生2个m2.xlarge类型的实例.我们正在考虑转而使用ElasticSearch来降低成本.但我在ElasticSearch的扩展上发现的是,它可以很好地扩展,可以分布在多个实例等.
但是这种数据需要什么样的机器(内存,光盘)?
如果我将数据量增加12倍(≈80,000万份文档),会如何改变?
scaling amazon-web-services elasticsearch amazon-cloudsearch
我有一个亚马逊云搜索域名.目的是过滤字段"语言"是否存在.并非所有对象都有一种语言,我希望有一些语言被过滤,但是那些没有任何语言的对象也会被返回.
我想过滤(或语言:'en'语言:null)
但是,无法在字符串中传递null.
这可能吗?如果是这样,它将如何完成.
我想从cloudsearch中检索所有可搜索的文档
我尝试做这样的负面搜索:
search-[mySearchEndPoint].cloudsearch.amazonaws.com/2011-02-01/search?bq=(not keywords: '!!!testtest!!!')
Run Code Online (Sandbox Code Playgroud)
它工作,但它也返回所有已删除的文件.
那么我怎样才能获得所有活动文档?
我在AWS CloudSearch索引中有大约150万个文档.这太耗费我了,我希望从服务中迁移出去.我一直无法看到如何从索引中下载或导出我的文档.可能吗?