使用R从Google学者那里获取论文

tim*_*tim 8 r web-scraping google-scholar

使用google-scholar和R,我想知道谁在引用某篇论文.

现有的包(如学者)面向H指数分析:研究人员的统计数据.

我想给目标纸作为输入.一个示例网址是:

https://scholar.google.co.uk/scholar?oi=bibs&hl=en&cites=12939847369066114508

然后R应该抓住这些引文页面(谷歌学者分页这些),然后返回一系列引用目标的论文(最多500个或更多引用).然后我们在标题中搜索关键词,列出期刊和引用作者等.

关于如何做到这一点的任何线索?或者是从字面上刮下每一页?(我可以使用复制和粘贴进行一次性操作).

看起来这应该是一个普遍有用的功能,如播种系统评论,所以有人添加到一个包可能会增加他们的H :-)

Uli*_*uri 1

尽管有很多可用的Google API,但基于 Google Scholar 的 API 不可用。因此,尽管谷歌学术页面上的网络爬虫开发起来可能并不困难,但我不知道它在多大程度上可能是非法的。检查这个