对于每一行，确定 R 中具有相同值的列的比例

Question

对于每一行，确定 R 中具有相同值的列的比例

我有一个与此类似的调查回复数据集：

toy <- data.frame(v1 = c(1,2,3), v2 = c(1,6,3), v3 = c(1,2,4), v4 = c(1,7,3))

toy
  v1 v2 v3 v4
1  1  1  1  1
2  2  6  2  7
3  3  3  4  3

Run Code Online (Sandbox Code Playgroud)

我想通过查找每行最常见的值并计算具有该值的列的比例来检测“直线”。

两个例子：

如果一行中每一列的值为 5，则新变量应返回 1
如果一行中 60% 的列的值为 3，40% 的列的值为 4，则该变量应返回 0.6

期望的输出：

  v1 v2 v3 v4 straightline_pct
1  1  1  1  1   1
2  2  6  2  7 .50
3  3  3  4  3 .75

Run Code Online (Sandbox Code Playgroud)

Answer 1

Col*_*ole 5

一种基本方法：

toy <- data.frame(v1 = c(1,2,3), v2 = c(1,6,3), v3 = c(1,2,4), v4 = c(1,7,3))

toy$straightline_pct = apply(as.matrix(toy),
                             1L,
                             function (x) max(prop.table(table(x)))
                             )

toy
#>   v1 v2 v3 v4 straightline_pct
#> 1  1  1  1  1             1.00
#> 2  2  6  2  7             0.50
#> 3  3  3  4  3             0.75

Run Code Online (Sandbox Code Playgroud)

归档时间：	3 年，11 月前
查看次数：	266 次
最近记录：	3 年，11 月前