小编art*_*hur的帖子

Pandas基于多列的分层采样

我有一个 pandas 数据框,如下所示:

| Cliid | Segment | Insert |
|-------|---------|--------|
| 001   | A       | 0      |
| 002   | A       | 0      |
| 003   | C       | 0      |
| 004   | B       | 1      |
| 005   | A       | 0      |
| 006   | B       | 0      |
Run Code Online (Sandbox Code Playgroud)

我想将其分成 2 组,每组的 [Segment, Insert] 中每个变量的组成都相同。例如,每个组有 1/2 的观测值属于 A 段,1/6 的插入 = 1,依此类推。

我已经检查过这个答案,但它只对一个变量进行分层,它不适用于多个变量。

R 有这个函数可以做到这一点,但使用 R 不是一个选择。

顺便说一下,我使用的是Python 3。

python pandas

9
推荐指数
1
解决办法
1万
查看次数

标签 统计

pandas ×1

python ×1