我有一个简单的数据帧:
ID Col1 Col2 Col3 Col4
1 NA NA NA NA
1 5 10 NA NA
1 NA NA 15 20
2 NA NA NA NA
2 25 30 NA NA
2 NA NA 35 40
Run Code Online (Sandbox Code Playgroud)
我想重新格式化它:
ID Col1 Col2 Col3 Col4
1 5 10 15 20
2 25 30 35 40
Run Code Online (Sandbox Code Playgroud)
(请注意:真实数据集有数千行,而值来自生物数据 - NA除了NAs是不相交的,s之后没有简单的模式,是的,每个行正好有3行ID).
第一步:摆脱只有NA值的行.
从表面上看,这看起来很简单,但我遇到了一些问题.
complete.cases(DF)返回all FALSE,所以我不能真正使用它来删除所有NAs 的行,如DF[complete.cases(DF),].这是因为所有行至少包含一行NA.
由于NAs想要传播自己,其他方案使用is.na …