我是初学者 R 学习者,所以如果我说一些不连贯的话,请容忍我。
我有一个包含 5000 个元素的大向量变量,并且想知道这些是什么,知道有几次重复。R 的介绍除了基本的数据结构外似乎没有说什么,我不知道 R 是否提供了内置的这个功能。
如果没有这样的“数据结构”,是否有一些内置函数可以过滤掉向量或列表中的重复元素?
要删除向量中多次出现的值,请使用duplicated()
一个例子是
x <- c(1,2,3,3,4,5,5,6)
x[!duplicated(x)]
# [1] 1 2 3 4 5 6
Run Code Online (Sandbox Code Playgroud)
这将返回所有x
不 ( !
) 重复的值。
这也适用于更复杂的数据结构,例如data.frames
. 请参阅?duplicated
获取更多信息。
unique(x)
提供向量中出现的所有值。
table(x)
显示向量中的独特值及其出现次数x
table(x)
# x
# 1 2 3 4 5 6
# 1 1 2 1 2 1
Run Code Online (Sandbox Code Playgroud)