小编Shw*_*ble的帖子

在pyspark随机取样,更换

我有一个9000唯一ID的数据帧df.

喜欢

| id |
  1 
  2 
Run Code Online (Sandbox Code Playgroud)

我想生成一个随机样本,替换这些9000 ID 100000次.我怎么在pyspark中做到这一点

我试过df.sample(True,0.5,100)

但我不知道如何准确到达100000号码

random apache-spark-sql pyspark

8
推荐指数
1
解决办法
1万
查看次数

标签 统计

apache-spark-sql ×1

pyspark ×1

random ×1