从 R 笔记本访问 Azure Blob 存储

use*_*794 3 r azure azure-storage sparkr

在 python 中,这就是我从 Azure blob 访问 csv 的方式

storage_account_name = "testname"
storage_account_access_key = "..."
file_location = "wasb://example@testname.blob.core.windows.net/testfile.csv"

spark.conf.set(
  "fs.azure.account.key."+storage_account_name+".blob.core.windows.net",
  storage_account_access_key)

df = spark.read.format('csv').load(file_location, header = True, inferSchema = True)
Run Code Online (Sandbox Code Playgroud)

我怎样才能在 R 中做到这一点?我找不到任何文档...

Hon*_*Ooi 6

AzureStor包提供了 Azure 存储R 接口,包括文件、blob 和 ADLSgen2。

endp <- storage_endpoint("https://acctname.blob.core.windows.net", key="access_key")
cont <- storage_container(endp, "mycontainer")
storage_download(cont, "myblob.csv", "local_filename.csv")
Run Code Online (Sandbox Code Playgroud)

请注意,这将下载到本地存储中的文件。从那里,您可以使用标准 Sparklyr 方法摄取 Spark。

免责声明:我是 AzureStor 的作者。