小编Sye*_*med的帖子

创建具有多列索引的 Pandas 数据框

我在创建具有多索引问题的 Pandas Dataframe 时遇到问题。在下面的数据中,你会看到这是2家银行的数据,每家银行有2个资产,每个资产有3个特征。我的数据具有类似的结构,我想从中创建一个数据框。

Data = [[[2,4,5],[3,4,5]],[[6,7,8],[9,10,11]]]

Banks = ['Bank1', 'Bank2']

Assets = ['Asset1', 'Asset2']

Asset_feature = ['private','public','classified']
Run Code Online (Sandbox Code Playgroud)

我尝试了各种方法来做到这一点,但我总是无法创建准确的数据框。结果应该是这样的:

      Asset1                      Asset2
      private public classified   private public classified
Bank1   2       4       5           3       4       5
Bank2   6       7       8           9       10      11
Run Code Online (Sandbox Code Playgroud)

任何帮助将非常感激。

python multi-index dataframe pandas

5
推荐指数
1
解决办法
4249
查看次数

去除特定列 R 中的 NA

虽然在这个论坛上已经提出了很多这样的问题,但我已经解决了其中的大部分问题,我的问题有点不同。我有一个数据框:

A  B  C  key
NA NA NA LIMA
3  1  NA GAMMA
NA NA NA SIGNA
NA 2  NA BETA
NA NA 4  SIGMA
Run Code Online (Sandbox Code Playgroud)

我想删除特征集(A、B、C)上有 NA 的行。键永远不会为空,也永远不会有缺失值。所以生成的框架看起来像:

A  B  C  key
3  1  NA GAMMA
NA 2  NA BETA
NA NA 4  SIGMA
Run Code Online (Sandbox Code Playgroud)

可以从下面复制类似数据帧的结构

structure(list(A = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), B = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), C = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), D = c(NA_real_, NA_real_, NA_real_, NA_real_, 
NA_real_, NA_real_), E = c(NA_real_, …
Run Code Online (Sandbox Code Playgroud)

r na dplyr

1
推荐指数
1
解决办法
50
查看次数

通过满足条件的 Group ID 对多列的观察进行计数和平均值

我在 R 中遇到了我在下面描述的问题。我需要满足条件的每个组 ID 的所有列(避免 NA)的计数和平均值。

我有下面的数据集,其中有一个附加列。“T”

    structure(list(ID = c(1L, 1L, 1L, 2L, 3L, 3L), S1 = c(NA, 5L, 
1L, 2L, 4L, 2L), S2 = c(1L, 2L, 3L, 7L, NA, 11L), T = c(3L, 3L, 
3L, 5L, 2L, 2L)), class = "data.frame", row.names = c("1", "2", 
"3", "4", "5", "6"))
Run Code Online (Sandbox Code Playgroud)

是否可以只在列满足条件时(列值<= T值)才能得到每列的计数和平均值;(在原始数据集中,不仅仅是 S1 和 S2..)

生成的数据框应如下所示:

  ID S1.count S2.count S1.overall S2.overall S1.per S2.per
1 1  1        3        2          3          0.5    1.0  
2 2  1        0        1          1          1.0    0.0
3 …
Run Code Online (Sandbox Code Playgroud)

r dplyr

0
推荐指数
1
解决办法
49
查看次数

标签 统计

dplyr ×2

r ×2

dataframe ×1

multi-index ×1

na ×1

pandas ×1

python ×1