我是 R 的新手,正在寻找计算 h 指数。
H指数是量化科学生产力的流行指标。形式上,如果f是对应于每个出版物的引用次数的函数,我们计算 h 指数如下:
首先,我们将值f从最大值到最小值排序。然后,我们寻找最后一个f大于或等于该位置的位置(我们称这个位置为 h)。
例如,如果我们有一位研究人员发表了 5 篇论文 A、B、C、D 和 E,分别有 10、8、5、4 和 3 次引用,那么 h 指数等于 4,因为第 4 次发表有 4 次引用而第 5 篇只有 3。相反,如果相同的出版物有 25、8、5、3 和 3 次引用,那么索引为 3,因为第四篇论文只有 3 次引用。
谁能建议更聪明的方法来解决这个问题
a <- c(10,8,5,4,3)
Run Code Online (Sandbox Code Playgroud)
我期望 h 索引值的输出为 4。
我有以下用户统计数据框:
ID User VisitTime
1 Ra 08:00
1 Ma 15:13
2 Da 20:15
2 La 11:00
Run Code Online (Sandbox Code Playgroud)
如何创建一个数据框,其中包含另一列名为“标签”的列来显示上午、下午和晚上的时间?我参考了 Stackoverflow 上的一些帖子并使用过dplyr group_by,但未能产生预期的结果。
基本上我正在寻找这个数据框:
ID User VisitTime Label
1 Ra 08:00 Morning
1 Ma 15:13 Evening
2 Da 20:15 Night
2 La 11:00 Morning
Run Code Online (Sandbox Code Playgroud)