如何删除具有相同名称的所有列(tidyverse 或 base R)?

Kha*_*hir 1 r dplyr data-cleaning

我的数据集有几个同名的列,我想删除它们。

不幸的是,select(data, -Offender)它不起作用 ( Error: Can't bind data because some arguments have the same name),但我也无法janitor::clean_names克服这个问题——我需要对列名的其余部分保持不变。

我尝试使用基数 R ( df1 <- subset(df1, select = -c(Offender))),但它随后重命名了其他罪犯。#

Lyn*_*akr 5

这是一个基本的解决方案。

# Create data frame
df <- data.frame(runif(10), runif(10), runif(10), runif(10))
names(df) <- c("foo", "bar", "bar", "bar")

# Examine data
print(df)
#>          foo       bar       bar        bar
#> 1  0.4126322 0.1436917 0.4870304 0.80514914
#> 2  0.1642798 0.7948858 0.7741611 0.64353516
#> 3  0.6485090 0.6607900 0.9260459 0.75226835
#> 4  0.5254531 0.5535233 0.5746025 0.07131740
#> 5  0.1367792 0.4830001 0.4947695 0.46050685
#> 6  0.9517484 0.5750567 0.2231635 0.20050668
#> 7  0.9535626 0.1362335 0.5429668 0.07581875
#> 8  0.6679136 0.5017095 0.3106441 0.02235911
#> 9  0.4489072 0.3811038 0.1922099 0.07851105
#> 10 0.7724686 0.1284880 0.4240226 0.44462081

# Remove all columns called "bar"
df[, "bar" == names(df)] <- NULL

# Examine data again
print(df)
#>          foo
#> 1  0.4126322
#> 2  0.1642798
#> 3  0.6485090
#> 4  0.5254531
#> 5  0.1367792
#> 6  0.9517484
#> 7  0.9535626
#> 8  0.6679136
#> 9  0.4489072
#> 10 0.7724686
Run Code Online (Sandbox Code Playgroud)

reprex 包(v0.3.0)于 2019 年 6 月 24 日创建