Q1. 我试图使用带有参数 withReplacement: false,fraction: 0.6 的示例函数从 Spark 数据帧(13 行)中获取一个简单的随机样本,但每次运行它时它都会给我不同大小的样本,尽管它在以下情况下工作正常我设置了第三个参数(种子)。为什么这样?
Q2。随机数生成后样本是如何获得的?
提前致谢
scala dataframe apache-spark apache-spark-sql pyspark
apache-spark ×1
apache-spark-sql ×1
dataframe ×1
pyspark ×1
scala ×1