标签: doi

在文档或页面中查找DOI

DOI系统主要放在什么是没有有用的限制合理的标识符.但是,能够从PDF,网页等中提取DOI对于引用信息等非常有用.

有没有一种可靠的方法来识别文本块中的DOI而不假设'doi:'前缀?(任何语言都可接受,正则表达首选,并且必须避免误报)

regex doi

44
推荐指数
3
解决办法
8732
查看次数

从DOI获取元数据

数字对象标识符(DOI)是全局唯一的字符串,用于标识电子文档(例如,学术文章的PDF).它本质上提供了一种创建文档永久链接的方法(例如,http://dx.doi.org/10.1145/146585.146609).

是否有Web服务(或任何其他系统)来获取给定DOI的文档的元数据(最好是BibTeX形式)?

编辑添加一些说明信息.

doi metadata bibtex

32
推荐指数
3
解决办法
5480
查看次数

如何使用R搜索PubMed或其他数据库

我最近一直在使用优秀的rplos软件包,这使得搜索公共科学图书馆(PLOS)API上的论文非常容易.我遇到了麻烦,因为API本身似乎有一些缺失的信息 - 一个主要的问题是至少有2012年关于API的论文在"期刊"领域没有任何信息.我有每篇论文的DOI,所以对于谷歌这个DOI来说很简单,并且证明这些是在真实期刊上发表的真实论文,通常是PLoS ONE.显然,做2000次这样做会很愚蠢.

如果我有DOI列表,我想知道是否有人知道如何找到源期刊?我查看了RISmed包,它显然可以从R中搜索PubMed,但我无法弄清楚如何让它提供有用的信息(只是搜索命中的数量,以及一些可能导致我想要的信息的PubMed ID) .

任何人都知道如何将DOI列表转换为源日记帐名称?

编辑:我只想到另一个简单的解决方案.DOI包含期刊名称的缩写,对于这样的情况,只有少数期刊,可以使用正则表达式来读取DOI并选择它们来自哪个期刊.示例:10.1371/journal.pone .0046711来自PLoS ONE.

doi r pubmed ropensci

8
推荐指数
1
解决办法
1876
查看次数

反向查找数字对象标识符给出引用表?

我有一个引用表,其中包括第一作者的姓氏,每个引文的标题,期刊,年份和页码.

我在谷歌文档csv版本上发布了表格的前几行(并非所有记录都有doi)

我希望能够查询每个引用的数字对象标识符.对于标题,最好是查询可以处理"模糊匹配".

我怎样才能做到这一点?

该表目前在MySQL中,但以.csv文件开始和结束就足够了(我希望从开始到结束都能得到答案)(或者,因为我主要使用R,一个R数据帧).

xml doi r mechanize web-scraping

7
推荐指数
3
解决办法
1522
查看次数

7
推荐指数
1
解决办法
599
查看次数

网页抓取填写(并检索)搜索表单?

我想知道是否有可能"自动化"输入条目以搜索表单并从结果中提取匹配项的任务.例如,我有一份期刊文章列表,我想获得DOI(数字对象标识符); 手动为此我会去期刊文章搜索页面(例如,http://pubs.acs.org/search/advanced),输入作者/标题/卷(等),然后找到它的文章返回结果列表,然后选择DOI并将其粘贴到我的参考列表中.我经常使用R和Python进行数据分析(我的灵感来自于RCurl上的一篇文章),但对网络协议知之甚少......这样的事情是否可能(例如使用类似Python的BeautifulSoup?).做任何类似于此任务的远程操作都有什么好的参考吗?我对学习网络抓取和网络抓取工具一样兴趣,就像完成这项特殊任务一样...感谢您的时间!

forms search screen-scraping doi

6
推荐指数
2
解决办法
8150
查看次数

数字对象标识符的最大长度?

我想在我的数据库中添加一个存储DOI的字段.但我似乎无法找出它们的最大长度.有谁知道是否有最大长度?

database doi

6
推荐指数
2
解决办法
1340
查看次数

从DOI或Title的科学文献中提取摘要/全文

有很多工具可以从PDF文件中提取文本[1-4].然而,大多数科学论文的问题是直接获取PDF的困难主要是由于需要付费.除了bibtex信息之外,还有一些工具可以轻松访问论文的信息,如元数据或bibtex [5-6].我想要的是向前迈出一步,超越bibtex /元数据:

假设没有直接访问出版物的PDF文件,有没有办法至少获得科学论文的摘要给出论文的DOI或标题?通过我的搜索,我发现有一些尝试[7]用于某些类似的目的.有谁知道一个网站/工具,可以帮助我获取/提取科学论文的摘要或全文?如果没有这样的工具,你能否就解决这个问题后我应该怎么做?

谢谢

[1] http://stackoverflow.com/questions/1813427/extracting-information-from-pdfs-of-research-papers
[2] https://stackoverflow.com/questions/6731735/extracting-the-actual-in-text-title-from-a-pdf
[3] http://stackoverflow.com/questions/6731735/extracting-the-actual-in-text-title-from-a-pdf?lq=1
[4] http://stackoverflow.com/questions/14291856/extracting-article-contents-from-pdf-magazines?rq=1
[5] https://stackoverflow.com/questions/10507049/get-metadata-from-doi
[6] https://github.com/venthur/gscholar
[7] https://stackoverflow.com/questions/15768499/extract-text-from-google-scholar
Run Code Online (Sandbox Code Playgroud)

full-text-search doi title abstract extraction

6
推荐指数
1
解决办法
2636
查看次数

请问是否有 R 代码集使用 PubMed ID 或 DOI 来获取该文章的数据文件?

我正在尝试从 NCBI 或 PubMed 获取与数百个唯一 DOI 或 PMID 相关或附加的数据文件名,使用 R 语言。例如。我有 PMID:19122651 并且,我想获得连接到它的三个 GSE 的名称,它们是:GSE12781、GSE12782 和 GSE12783。我搜索了各种来源和软件包,但无济于事。
感谢您的帮助。

doi r data-files ncbi pubmed

3
推荐指数
1
解决办法
166
查看次数

CrossRef Rest API 与 Zenodo DOI

是否可以使用 CrossRef Rest API 获取 Zenodo 中出版物的元数据?

例如,调用https://api.crossref.org/works/10.5281/zenodo.2594632返回SyntaxError: JSON.parse: unexpected character at line 1 column 1 of the JSON data.

doi zenodo

2
推荐指数
1
解决办法
432
查看次数

r 将 DOI 列表转换为 BibTeX

我有一个 DOI 列表,我想将其转换为 BibTeX 记录。bib2doi 包似乎不起作用,所以我使用 R 的curl 包编写了以下代码来扫描列表,创建 bibtex 记录并将其附加到文件中。它对于许多 DOI 都可以正常工作,但(Failed to connect to data.chinadoi.cn port 80: Connection refused)对于 DOI会返回此错误10.11975/j.issn.1002-6819.2017.z1.035。我不知道如何写出错误的 DOI 并继续下去。这是包含三个 DOI 的代码,第二个 DOI 是失败的。

library(curl)
DOIlist <- c("10.1111/1748-5967.12330", "10.11975/j.issn.1002-6819.2017.z1.035", "10.1016/j.envsci.2019.03.017")

h <- new_handle()
handle_setheaders(h, "accept" = "application/x-bibtex")

for (i in 1:length(DOIlist)) {
  url <- paste0("https://doi.org/", DOIlist[i])
  print(paste0("url: ", url))
  curl_download(url, destfile = "curltest.bib", handle = h, mode = "a")
}
Run Code Online (Sandbox Code Playgroud)

curl doi r

1
推荐指数
1
解决办法
825
查看次数