小编Sye*_*med的帖子

创建具有多列索引的 Pandas 数据框

我在创建具有多索引问题的 Pandas Dataframe 时遇到问题。在下面的数据中，你会看到这是2家银行的数据，每家银行有2个资产，每个资产有3个特征。我的数据具有类似的结构，我想从中创建一个数据框。

Data = [[[2,4,5],[3,4,5]],[[6,7,8],[9,10,11]]]

Banks = ['Bank1', 'Bank2']

Assets = ['Asset1', 'Asset2']

Asset_feature = ['private','public','classified']

Run Code Online (Sandbox Code Playgroud)

我尝试了各种方法来做到这一点，但我总是无法创建准确的数据框。结果应该是这样的：

      Asset1                      Asset2
      private public classified   private public classified
Bank1   2       4       5           3       4       5
Bank2   6       7       8           9       10      11

Run Code Online (Sandbox Code Playgroud)

任何帮助将非常感激。

python multi-index dataframe pandas

Sye*_*med

lucky-day

5
推荐指数

1
解决办法

4249
查看次数

去除特定列 R 中的 NA

虽然在这个论坛上已经提出了很多这样的问题，但我已经解决了其中的大部分问题，我的问题有点不同。我有一个数据框：

A  B  C  key
NA NA NA LIMA
3  1  NA GAMMA
NA NA NA SIGNA
NA 2  NA BETA
NA NA 4  SIGMA

Run Code Online (Sandbox Code Playgroud)

我想删除特征集（A、B、C）上有 NA 的行。键永远不会为空，也永远不会有缺失值。所以生成的框架看起来像：

A  B  C  key
3  1  NA GAMMA
NA 2  NA BETA
NA NA 4  SIGMA

Run Code Online (Sandbox Code Playgroud)

可以从下面复制类似数据帧的结构

structure(list(A = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), B = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), C = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), D = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), E = c(NA_real_, …

Run Code Online (Sandbox Code Playgroud)

r na dplyr

Sye*_*med

lucky-day

1
推荐指数

1
解决办法

50
查看次数

通过满足条件的 Group ID 对多列的观察进行计数和平均值

我在 R 中遇到了我在下面描述的问题。我需要满足条件的每个组 ID 的所有列（避免 NA）的计数和平均值。

我有下面的数据集，其中有一个附加列。“T”

    structure(list(ID = c(1L, 1L, 1L, 2L, 3L, 3L), S1 = c(NA, 5L, 
1L, 2L, 4L, 2L), S2 = c(1L, 2L, 3L, 7L, NA, 11L), T = c(3L, 3L, 
3L, 5L, 2L, 2L)), class = "data.frame", row.names = c("1", "2", 
"3", "4", "5", "6"))

Run Code Online (Sandbox Code Playgroud)

是否可以只在列满足条件时（列值<= T值）才能得到每列的计数和平均值；（在原始数据集中，不仅仅是 S1 和 S2..）

生成的数据框应如下所示：

  ID S1.count S2.count S1.overall S2.overall S1.per S2.per
1 1  1        3        2          3          0.5    1.0  
2 2  1        0        1          1          1.0    0.0
3 …

Run Code Online (Sandbox Code Playgroud)

r dplyr

Sye*_*med

2020 08-11

0
推荐指数

1
解决办法

49
查看次数