小编djM*_*hit的帖子

如何编写函数来计算 R 中的 H 指数?

我是 R 的新手,正在寻找计算 h 指数。

H指数是量化科学生产力的流行指标。形式上,如果f是对应于每个出版物的引用次数的函数,我们计算 h 指数如下:

首先,我们将值f从最大值到最小值排序。然后,我们寻找最后一个f大于或等于该位置的位置(我们称这个位置为 h)。

例如,如果我们有一位研究人员发表了 5 篇论文 A、B、C、D 和 E,分别有 10、8、5、4 和 3 次引用,那么 h 指数等于 4,因为第 4 次发表有 4 次引用而第 5 篇只有 3。相反,如果相同的出版物有 25、8、5、3 和 3 次引用,那么索引为 3,因为第四篇论文只有 3 次引用。

谁能建议更聪明的方法来解决这个问题

a <- c(10,8,5,4,3)
Run Code Online (Sandbox Code Playgroud)

我期望 h 索引值的输出为 4。

r function

2
推荐指数
1
解决办法
666
查看次数

按特定标准对数据进行分组

我有以下用户统计数据框:

ID    User      VisitTime
1     Ra          08:00
1     Ma          15:13
2     Da          20:15
2     La          11:00
Run Code Online (Sandbox Code Playgroud)

如何创建一个数据框,其中包含另一列名为“标签”的列来显示上午、下午和晚上的时间?我参考了 Stackoverflow 上的一些帖子并使用过dplyr group_by,但未能产生预期的结果。

基本上我正在寻找这个数据框:

ID    User      VisitTime    Label
1     Ra          08:00      Morning 
1     Ma          15:13      Evening
2     Da          20:15      Night
2     La          11:00      Morning 
Run Code Online (Sandbox Code Playgroud)

grouping r dplyr

1
推荐指数
1
解决办法
188
查看次数

标签 统计

r ×2

dplyr ×1

function ×1

grouping ×1