我有一个9000唯一ID的数据帧df.
喜欢
| id | 1 2
我想生成一个随机样本,替换这些9000 ID 100000次.我怎么在pyspark中做到这一点
我试过df.sample(True,0.5,100)
但我不知道如何准确到达100000号码
random apache-spark-sql pyspark
apache-spark-sql ×1
pyspark ×1
random ×1