获取reddit数据

Bud*_*est 24 reddit web-scraping

我有兴趣从不同的reddit subreddit获取数据.有没有人知道是否有类似twitter的reddit/other api会抓取所有页面?

bbo*_*boe 33

是的,reddit有一个API,可用于各种目的,如数据收集,自动评论机器人,甚至协助subreddit审核.

有几个地方可以发现有关reddit API的信息:

如果您已经熟悉某种特定的编程语言,那么您应该查看各种语言的现有API包装器.尽管我有偏见(我是软件包维护者),但我非常肯定PRAW,对于python,它支持最大数量的reddit API功能.


Hay*_*ech 13

请注意,如果您只是阅读数据,并且对回发到reddit不感兴趣,则可以从与每个subreddit关联的json提要中获取相当多的数据.使用此方法,您根本不需要担心API - 您只需请求相关的json文件并使用您选择的语言对其进行解析.

这是一个示例URL,它将返回一个json对象,其中包含来自Justrolledintotheshop subreddit的热帖:https://www.reddit.com/r/Justrolledintotheshop/top.json

在顶部的地方,你可以使用hot,newcontroversial.使用top时,您可以添加?t=day到网址的末尾以指定当天的热门帖子.其他有效值为hour,day,week,month,year,或all.