甲数字对象标识符(DOI)是全局唯一的字符串,用于标识电子文档(例如,学术文章的PDF).它本质上提供了一种创建文档永久链接的方法(例如,http://dx.doi.org/10.1145/146585.146609).
是否有Web服务(或任何其他系统)来获取给定DOI的文档的元数据(最好是BibTeX形式)?
编辑添加一些说明信息.
我最近一直在使用优秀的rplos软件包,这使得搜索公共科学图书馆(PLOS)API上的论文非常容易.我遇到了麻烦,因为API本身似乎有一些缺失的信息 - 一个主要的问题是至少有2012年关于API的论文在"期刊"领域没有任何信息.我有每篇论文的DOI,所以对于谷歌这个DOI来说很简单,并且证明这些是在真实期刊上发表的真实论文,通常是PLoS ONE.显然,做2000次这样做会很愚蠢.
如果我有DOI列表,我想知道是否有人知道如何找到源期刊?我查看了RISmed包,它显然可以从R中搜索PubMed,但我无法弄清楚如何让它提供有用的信息(只是搜索命中的数量,以及一些可能导致我想要的信息的PubMed ID) .
任何人都知道如何将DOI列表转换为源日记帐名称?
编辑:我只想到另一个简单的解决方案.DOI包含期刊名称的缩写,对于这样的情况,只有少数期刊,可以使用正则表达式来读取DOI并选择它们来自哪个期刊.示例:10.1371/journal.pone .0046711来自PLoS ONE.
我看到GitHub 通过Zenodo进行了DOI集成,但Bitbucket是否有相同的工具?
或者我是否必须直接联系DOI注册机构?
我想知道是否有可能"自动化"输入条目以搜索表单并从结果中提取匹配项的任务.例如,我有一份期刊文章列表,我想获得DOI(数字对象标识符); 手动为此我会去期刊文章搜索页面(例如,http://pubs.acs.org/search/advanced),输入作者/标题/卷(等),然后找到它的文章返回结果列表,然后选择DOI并将其粘贴到我的参考列表中.我经常使用R和Python进行数据分析(我的灵感来自于RCurl上的一篇文章),但对网络协议知之甚少......这样的事情是否可能(例如使用类似Python的BeautifulSoup?).做任何类似于此任务的远程操作都有什么好的参考吗?我对学习网络抓取和网络抓取工具一样兴趣,就像完成这项特殊任务一样...感谢您的时间!
有很多工具可以从PDF文件中提取文本[1-4].然而,大多数科学论文的问题是直接获取PDF的困难主要是由于需要付费.除了bibtex信息之外,还有一些工具可以轻松访问论文的信息,如元数据或bibtex [5-6].我想要的是向前迈出一步,超越bibtex /元数据:
假设没有直接访问出版物的PDF文件,有没有办法至少获得科学论文的摘要给出论文的DOI或标题?通过我的搜索,我发现有一些尝试[7]用于某些类似的目的.有谁知道一个网站/工具,可以帮助我获取/提取科学论文的摘要或全文?如果没有这样的工具,你能否就解决这个问题后我应该怎么做?
谢谢
[1] http://stackoverflow.com/questions/1813427/extracting-information-from-pdfs-of-research-papers
[2] https://stackoverflow.com/questions/6731735/extracting-the-actual-in-text-title-from-a-pdf
[3] http://stackoverflow.com/questions/6731735/extracting-the-actual-in-text-title-from-a-pdf?lq=1
[4] http://stackoverflow.com/questions/14291856/extracting-article-contents-from-pdf-magazines?rq=1
[5] https://stackoverflow.com/questions/10507049/get-metadata-from-doi
[6] https://github.com/venthur/gscholar
[7] https://stackoverflow.com/questions/15768499/extract-text-from-google-scholar
Run Code Online (Sandbox Code Playgroud) 我正在尝试从 NCBI 或 PubMed 获取与数百个唯一 DOI 或 PMID 相关或附加的数据文件名,使用 R 语言。例如。我有 PMID:19122651 并且,我想获得连接到它的三个 GSE 的名称,它们是:GSE12781、GSE12782 和 GSE12783。我搜索了各种来源和软件包,但无济于事。
感谢您的帮助。
是否可以使用 CrossRef Rest API 获取 Zenodo 中出版物的元数据?
例如,调用https://api.crossref.org/works/10.5281/zenodo.2594632返回SyntaxError: JSON.parse: unexpected character at line 1 column 1 of the JSON data.
我有一个 DOI 列表,我想将其转换为 BibTeX 记录。bib2doi 包似乎不起作用,所以我使用 R 的curl 包编写了以下代码来扫描列表,创建 bibtex 记录并将其附加到文件中。它对于许多 DOI 都可以正常工作,但(Failed to connect to data.chinadoi.cn port 80: Connection refused)对于 DOI会返回此错误10.11975/j.issn.1002-6819.2017.z1.035。我不知道如何写出错误的 DOI 并继续下去。这是包含三个 DOI 的代码,第二个 DOI 是失败的。
library(curl)
DOIlist <- c("10.1111/1748-5967.12330", "10.11975/j.issn.1002-6819.2017.z1.035", "10.1016/j.envsci.2019.03.017")
h <- new_handle()
handle_setheaders(h, "accept" = "application/x-bibtex")
for (i in 1:length(DOIlist)) {
url <- paste0("https://doi.org/", DOIlist[i])
print(paste0("url: ", url))
curl_download(url, destfile = "curltest.bib", handle = h, mode = "a")
}
Run Code Online (Sandbox Code Playgroud)