Kha*_*hir 1 r dplyr data-cleaning
我的数据集有几个同名的列,我想删除它们。
不幸的是,select(data, -Offender)
它不起作用 ( Error: Can't bind data because some arguments have the same name
),但我也无法janitor::clean_names
克服这个问题——我需要对列名的其余部分保持不变。
我尝试使用基数 R ( df1 <- subset(df1, select = -c(Offender))
),但它随后重命名了其他罪犯。#
这是一个基本的解决方案。
# Create data frame
df <- data.frame(runif(10), runif(10), runif(10), runif(10))
names(df) <- c("foo", "bar", "bar", "bar")
# Examine data
print(df)
#> foo bar bar bar
#> 1 0.4126322 0.1436917 0.4870304 0.80514914
#> 2 0.1642798 0.7948858 0.7741611 0.64353516
#> 3 0.6485090 0.6607900 0.9260459 0.75226835
#> 4 0.5254531 0.5535233 0.5746025 0.07131740
#> 5 0.1367792 0.4830001 0.4947695 0.46050685
#> 6 0.9517484 0.5750567 0.2231635 0.20050668
#> 7 0.9535626 0.1362335 0.5429668 0.07581875
#> 8 0.6679136 0.5017095 0.3106441 0.02235911
#> 9 0.4489072 0.3811038 0.1922099 0.07851105
#> 10 0.7724686 0.1284880 0.4240226 0.44462081
# Remove all columns called "bar"
df[, "bar" == names(df)] <- NULL
# Examine data again
print(df)
#> foo
#> 1 0.4126322
#> 2 0.1642798
#> 3 0.6485090
#> 4 0.5254531
#> 5 0.1367792
#> 6 0.9517484
#> 7 0.9535626
#> 8 0.6679136
#> 9 0.4489072
#> 10 0.7724686
Run Code Online (Sandbox Code Playgroud)
由reprex 包(v0.3.0)于 2019 年 6 月 24 日创建