我刚刚开始学习 r 并且对课程中给出的以下问题感到困惑:
使用 dir.create() 和 file.path() 在当前工作目录中创建一个名为“testdir2”的目录和一个名为“testdir3”的子目录,所有这些都在一个命令中。
我无法接受我的答案,然后在网上找到了另一个提供答案的网站。这是另一个网站给出的答案:
dir.create(file.path('testdir2', 'testdir3'), recursive = TRUE)
Run Code Online (Sandbox Code Playgroud)
复制/粘贴此答案后,它仍然没有让我在课程中取得进步。答案有问题吗?
另外为什么我要使用 file.path 来创建文件夹。这样做是否更有意义:
dir.create("testdir2/testdir3", recursive = TRUE)
Run Code Online (Sandbox Code Playgroud)
使用 file.path 函数创建文件夹的目的是什么?
在本sparklyr教程中,我遵循它,它说我可以用来compute()将前面语句的结果存储dplyr到新的 Spark 数据框中。
“代码 1”中的代码创建了一个名为“NewSparkDataframe”的新 Spark 数据框,并spark_tbl创建了一个我分配给“NewTbl”的数据框。我可以使用查看 Spark 数据框src_tbls()。这一切都在预料之中。
如果我运行“代码 2”而不使用compute()它,仍然会创建一个spark_tbl我再次分配给“NewTbl”的代码。但这一次我无法使用 Spark 查看新的 Spark 数据帧src_tbls()。
spark_tbl我想知道如果 Spark 中显然没有“NewSparkDataframe”,“ NewTbl”如何能够运行代码 2?
另外,如果我仍然可以访问使用“NewTbl”compute()新创建的相同内容,那么使用还有什么意义?spark_tbl
代码1:
NewTbl <- mySparkTbl %>%
some dplyr statements %>%
compute("NewSparkDataframe")
src_tbls(spark_conn)
"NewSparkDataframe"
Run Code Online (Sandbox Code Playgroud)
代码2:
NewTbl <- mySparkTbl %>%
some dplyr statements
src_tbls(spark_conn)
Run Code Online (Sandbox Code Playgroud) 我正在尝试学习如何在 R 中使用 Rcpp。有人可以指出这段代码的问题所在。问题可能不止一个。
当在代码底部c输入对象fun()时,我希望它输出一个向量/数组,其值为“Home”、“Elsewhere”或“Number”。
我发现这里的数据类型有点令人困惑。我的原始数据集是一个因素。如果我把它放进去storage.mode()它会返回integer. 我假设我必须将x参数分配为IntegerVector. 这让我很困惑,因为数据包含字母,即“H”和“E”,那么数据怎么可能是整数呢?当我在 if 语句中说 == "H" 时,我不知道它是否理解我在说什么。
library(Rcpp)
c <- factor(c("E", "H", "E", "12", "10", "60", "80", "11", "H", "H"))
class(c)
storage.mode(c)
cppFunction(' IntegerVector fun(IntegerVector x){
// creates an empty character vector the size/length of x.
CharacterVector y = x.size() ;
int n = x.size() - 1 ;
//loop
for(int i = 0; i <= n; i = i + 1){
if(x[i] …Run Code Online (Sandbox Code Playgroud)