小编Ego*_*dym的帖子

Kolmogorov-Smirnov测试

我正在使用R函数ks.test()来测试R随机数生成器的均匀分布.我正在使用以下代码: replicate(100000, ks.test(runif(n),y="punif").

n小于或等于100时,它可以工作,但当n大于100时,我得到以下警告消息:

In ks.test(runif(100000), y = "punif") :
  ties should not be present for the Kolmogorov-Smirnov test.
Run Code Online (Sandbox Code Playgroud)

这些"关系"是什么?

simulation statistics r probability hypothesis-test

5
推荐指数
1
解决办法
1万
查看次数

写入SAS日志

我知道我可以用来%PUT在日志窗口中写一个文本字符串,但是如果我想在日志中写一个函数的结果PROBNORM(x)呢?有没有办法做到这一点?

sas

3
推荐指数
1
解决办法
167
查看次数

计算时间和结果

我在R中运行一些代码,我想报告计算时间和我正在运行的代码块的结果.由于计算需要一段时间,我想知道是否有办法输出(同时)计算时间和结果,而不必运行代码两次(因此需要花费两倍的时间).

r

1
推荐指数
1
解决办法
67
查看次数

比较 PySpark 中的 3 列

我想比较 PySpark 中的 3 列(百分比总和为 100%)以创建一个新列,其中包含 3 列最大值的列名,或者,如果最大值不唯一,则包含列名具有相同的价值。我在这里看到了一些类似的例子,但是当最大值不唯一时,它们不会处理这种情况。下面是我的蛮力解决方案,但运行需要很长时间才能变得无用:

df\
  .withColumn("MaxName", 
      F.when( (col(A)>col(B)) & (col(A)>col(C)), "A")\
      .when( (col(B)>col(A)) & (col(B)>col(C)), "B")\
      .when( (col(C)>col(A)) & (col(C)>col(B)), "C")\
      .when( (col(A)==col(B)) &\
            (col(A)>col(C)) | (col(B)>col(C)), "AB")\
      .when( (col(C)==col(B)) | (col(C)==col(A)) &\
            (col(C)>col(B)) | (col(C)>col(A)), "CAB")\
      .otherwise("ABC")
Run Code Online (Sandbox Code Playgroud)

任何见解来构建更有效的解决方案?

python apache-spark apache-spark-sql pyspark

1
推荐指数
1
解决办法
190
查看次数