我正在使用 python 访问 elasticsearch 集群。现在我想使用快照备份我的索引。最困难的是:python-elasticsearch 的文档只是给了我一个 API 描述。没有示例向我展示如何创建快照。我尝试了一些参数,但失败了。任何人都可以使用 python 给出弹性搜索的快照示例吗?以下是我的代码:
from elasticsearch import Elasticsearch
es = Elasticsearch()
snapshot_body = {
"type": "url",
"settings": {
"url": "http://download.elasticsearch.org/definitiveguide/sigterms_demo/"
}
}
body = {"snapshot": snapshot_body}
es.snapshot.create_repository(repository='test', body=body)
Run Code Online (Sandbox Code Playgroud) spark有两种压缩文件格式。一种是镶木地板,很容易阅读:
from pyspark.sql import HiveContext
hiveCtx = HiveContext(sc)
hiveCtx.parquetFile(parquetFile)
Run Code Online (Sandbox Code Playgroud)
但对于 ocr 文件。我找不到一个很好的例子来告诉我如何使用 pyspark 阅读。