上面的子集使用逻辑索引.有没有办法在dplyr中做到这一点?
此外,什么时候dplyr会自动删除NAs?根据我的经验,当我过滤掉特定字符串时,它会删除NA,例如:
b = a %>% filter(col != "str")
Run Code Online (Sandbox Code Playgroud)
我认为这不会排除NA价值,但确实如此.但是当我使用其他格式的过滤时,它不会自动排除NA,例如:
b = a %>% filter(!grepl("str", col))
Run Code Online (Sandbox Code Playgroud)
我想了解过滤器的这个功能.我将不胜感激任何帮助.谢谢!
我在dataframe列下面有一个数据-
X_ABC_123_DF</n>
A_NJU_678_PP</n>
J_HH_99_LL</n>
II_00_777_PPP</n>
Run Code Online (Sandbox Code Playgroud)
我想为数据帧中的每一行提取第二个和第三个下划线之间的值,我正计划创建一个新列并存储这些值。用R写这个。我不确定如何写它的regex函数。
^(?:[^_]+_){2}([^_ ]+)<br>
Run Code Online (Sandbox Code Playgroud)