请问是否有 R 代码集使用 PubMed ID 或 DOI 来获取该文章的数据文件?

Sha*_*awn 3 doi r data-files ncbi pubmed

我正在尝试从 NCBI 或 PubMed 获取与数百个唯一 DOI 或 PMID 相关或附加的数据文件名,使用 R 语言。例如。我有 PMID:19122651 并且,我想获得连接到它的三个 GSE 的名称,它们是:GSE12781、GSE12782 和 GSE12783。我搜索了各种来源和软件包,但无济于事。
感谢您的帮助。

nei*_*fws 5

你可以使用rentrez包来做到这一点。

所需的函数是entrez_link

例子:

library(rentrez)

results <- entrez_link(dbfrom = 'pubmed', id = 19122651, db = 'gds')

results$links$pubmed_gds
[1] "200012783" "200012782" "200012781"
Run Code Online (Sandbox Code Playgroud)

3 个结果是关联的 GEO 数据集记录的 ID。您可以使用entrez_summary.

这是一个有点难看的东西sapply,可以作为函数的基础:

sapply(results$links$pubmed_gds, function (id) entrez_summary("gds", id)$accession, 
       USE.NAMES = FALSE)

[1] "GSE12783" "GSE12782" "GSE12781"
Run Code Online (Sandbox Code Playgroud)

  • 没问题。`rentrez` 是一个很棒的包,非常值得了解。如果解决了问题,请采纳答案。 (2认同)