mrj*_*eph 3 r apache-spark sparkr orc sparklyr
我知道sparklyr有以下读取文件方法:
spark_read_csv
spark_read_parquet
spark_read_json
那么阅读orc文件怎么样?这个图书馆是否支持它?
您可以像我在使用sparklyr将数据从数据库传输到Spark的回答中描述的那样使用低级Spark API :
library(dplyr)
library(sparklyr)
sc <- spark_connect(...)
spark_session(sc) %>%
invoke("read") %>%
invoke("format", "orc") %>%
invoke("load", path) %>%
invoke("createOrReplaceTempView", name)
df <- tbl(sc, name)
Run Code Online (Sandbox Code Playgroud)
where name
是用于标识表的任意名称
在当前sparklyr
版本中,您应该可以使用以下内容替换spark_read_source
:
spark_read_source(sc, name, source = "orc", options = list(path = path))
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
1005 次 |
最近记录: |