例如,如果我有一个名为 companyId 的列和我想保留的许多其他列,并且在 companyId 中我有 100、101、102 等值,基本上是一个 Id 列表,每个 Id 出现不同的次数。如何根据 companyId 列随机抽样数据,以便根据每个 Id 的比例?
例如:如果我有 500 行和 100 个 companyA、100 个 companyB 和 300 个 companyC,我想从这个表中采样 100 行。如何让我的数据有 20 个 companyA、20 个 companyB 和 60 个 companyC?
非常感谢。