我在创建具有多索引问题的 Pandas Dataframe 时遇到问题。在下面的数据中,你会看到这是2家银行的数据,每家银行有2个资产,每个资产有3个特征。我的数据具有类似的结构,我想从中创建一个数据框。
Data = [[[2,4,5],[3,4,5]],[[6,7,8],[9,10,11]]]
Banks = ['Bank1', 'Bank2']
Assets = ['Asset1', 'Asset2']
Asset_feature = ['private','public','classified']
Run Code Online (Sandbox Code Playgroud)
我尝试了各种方法来做到这一点,但我总是无法创建准确的数据框。结果应该是这样的:
Asset1 Asset2
private public classified private public classified
Bank1 2 4 5 3 4 5
Bank2 6 7 8 9 10 11
Run Code Online (Sandbox Code Playgroud)
任何帮助将非常感激。
虽然在这个论坛上已经提出了很多这样的问题,但我已经解决了其中的大部分问题,我的问题有点不同。我有一个数据框:
A B C key
NA NA NA LIMA
3 1 NA GAMMA
NA NA NA SIGNA
NA 2 NA BETA
NA NA 4 SIGMA
Run Code Online (Sandbox Code Playgroud)
我想删除特征集(A、B、C)上有 NA 的行。键永远不会为空,也永远不会有缺失值。所以生成的框架看起来像:
A B C key
3 1 NA GAMMA
NA 2 NA BETA
NA NA 4 SIGMA
Run Code Online (Sandbox Code Playgroud)
可以从下面复制类似数据帧的结构
structure(list(A = c(NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_), B = c(NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_), C = c(NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_), D = c(NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_), E = c(NA_real_, …Run Code Online (Sandbox Code Playgroud) 我在 R 中遇到了我在下面描述的问题。我需要满足条件的每个组 ID 的所有列(避免 NA)的计数和平均值。
我有下面的数据集,其中有一个附加列。“T”
structure(list(ID = c(1L, 1L, 1L, 2L, 3L, 3L), S1 = c(NA, 5L,
1L, 2L, 4L, 2L), S2 = c(1L, 2L, 3L, 7L, NA, 11L), T = c(3L, 3L,
3L, 5L, 2L, 2L)), class = "data.frame", row.names = c("1", "2",
"3", "4", "5", "6"))
Run Code Online (Sandbox Code Playgroud)
是否可以只在列满足条件时(列值<= T值)才能得到每列的计数和平均值;(在原始数据集中,不仅仅是 S1 和 S2..)
生成的数据框应如下所示:
ID S1.count S2.count S1.overall S2.overall S1.per S2.per
1 1 1 3 2 3 0.5 1.0
2 2 1 0 1 1 1.0 0.0
3 …Run Code Online (Sandbox Code Playgroud)