小编luk*_*man的帖子

如何使用R搜索PubMed或其他数据库

我最近一直在使用优秀的rplos软件包,这使得搜索公共科学图书馆(PLOS)API上的论文非常容易.我遇到了麻烦,因为API本身似乎有一些缺失的信息 - 一个主要的问题是至少有2012年关于API的论文在"期刊"领域没有任何信息.我有每篇论文的DOI,所以对于谷歌这个DOI来说很简单,并且证明这些是在真实期刊上发表的真实论文,通常是PLoS ONE.显然,做2000次这样做会很愚蠢.

如果我有DOI列表,我想知道是否有人知道如何找到源期刊?我查看了RISmed包,它显然可以从R中搜索PubMed,但我无法弄清楚如何让它提供有用的信息(只是搜索命中的数量,以及一些可能导致我想要的信息的PubMed ID) .

任何人都知道如何将DOI列表转换为源日记帐名称?

编辑:我只想到另一个简单的解决方案.DOI包含期刊名称的缩写,对于这样的情况,只有少数期刊,可以使用正则表达式来读取DOI并选择它们来自哪个期刊.示例:10.1371/journal.pone .0046711来自PLoS ONE.

doi r pubmed ropensci

8
推荐指数
1
解决办法
1876
查看次数

从不同概率向量中采样的有效方法

我正在寻找一种更有效的方法来从整数列表1:n中抽样,多次,其中概率向量(也是长度n)每次都不同.对于n = 10的20次试验,我知道可以这样做:

probs <- matrix(runif(200), nrow = 20)
answers <- numeric(20)
for(i in 1:20) answers[i] <- sample(10,1,prob=probs[i,])
Run Code Online (Sandbox Code Playgroud)

但是,每次调用样本10次只是为了得到一个数字,所以它可能不是最快的方式.速度会有所帮助,因为代码会这么做很多次.

非常感谢!

卢克

编辑:非常感谢Roman,他对基准测试的想法帮助我找到了一个很好的解决方案.我现在把它转到了答案.

r sampling

5
推荐指数
1
解决办法
1980
查看次数

标签 统计

r ×2

doi ×1

pubmed ×1

ropensci ×1

sampling ×1