小编djM*_*hit的帖子

如何编写函数来计算 R 中的 H 指数？

我是 R 的新手，正在寻找计算 h 指数。

H指数是量化科学生产力的流行指标。形式上，如果f是对应于每个出版物的引用次数的函数，我们计算 h 指数如下：

首先，我们将值f从最大值到最小值排序。然后，我们寻找最后一个f大于或等于该位置的位置（我们称这个位置为 h）。

例如，如果我们有一位研究人员发表了 5 篇论文 A、B、C、D 和 E，分别有 10、8、5、4 和 3 次引用，那么 h 指数等于 4，因为第 4 次发表有 4 次引用而第 5 篇只有 3。相反，如果相同的出版物有 25、8、5、3 和 3 次引用，那么索引为 3，因为第四篇论文只有 3 次引用。

谁能建议更聪明的方法来解决这个问题

a <- c(10,8,5,4,3)

Run Code Online (Sandbox Code Playgroud)

我期望 h 索引值的输出为 4。

r function

djM*_*hit

2019 05-22

2
推荐指数

1
解决办法

666
查看次数

按特定标准对数据进行分组

我有以下用户统计数据框：

ID    User      VisitTime
1     Ra          08:00
1     Ma          15:13
2     Da          20:15
2     La          11:00

Run Code Online (Sandbox Code Playgroud)

如何创建一个数据框，其中包含另一列名为“标签”的列来显示上午、下午和晚上的时间？我参考了 Stackoverflow 上的一些帖子并使用过dplyr group_by，但未能产生预期的结果。

基本上我正在寻找这个数据框：

ID    User      VisitTime    Label
1     Ra          08:00      Morning 
1     Ma          15:13      Evening
2     Da          20:15      Night
2     La          11:00      Morning

Run Code Online (Sandbox Code Playgroud)

grouping r dplyr

djM*_*hit

lucky-day

1
推荐指数

1
解决办法

188
查看次数