我正面临一个特定的经验问题。我在 data.frame 列中有一个因变量。我可以轻松删除所有 NA 和所有非数字术语(不幸的是,这是一个开放式文本设计问题)。但是在那些非数字条目中有一些字符串和其他信息,我想手动检查(为了可能的插补)。
df <- data.frame(list(A=c(1, 2, 3, 4, 5, 6, 7, 8, 9), B=c("40g", "< 2", "thx", "about 1", "1-2", "1/2", 3, 2.3, "two")))
A B
1 1 40g
2 2 < 2
3 3 thx
4 4 about 1
5 5 1-2
6 6 1/2
7 7 3
8 8 2.3
9 9 two
Run Code Online (Sandbox Code Playgroud)
我认为没有特定的例程来列出所有非数字条目,并在每种情况下询问我是否要保留它或替换此条目的另一个值。但也许这至少对整个列来说是可能的?
最后我想得到以下结构:
A B
1 1 0.4
2 2 NA
3 3 NA
4 4 1.0
5 5 1.5
6 6 NA …Run Code Online (Sandbox Code Playgroud)