Bud*_*est 24 reddit web-scraping
我有兴趣从不同的reddit subreddit获取数据.有没有人知道是否有类似twitter的reddit/other api会抓取所有页面?
bbo*_*boe 33
是的,reddit有一个API,可用于各种目的,如数据收集,自动评论机器人,甚至协助subreddit审核.
有几个地方可以发现有关reddit API的信息:
如果您已经熟悉某种特定的编程语言,那么您应该查看各种语言的现有API包装器.尽管我有偏见(我是软件包维护者),但我非常肯定PRAW,对于python,它支持最大数量的reddit API功能.
Hay*_*ech 13
请注意,如果您只是阅读数据,并且对回发到reddit不感兴趣,则可以从与每个subreddit关联的json提要中获取相当多的数据.使用此方法,您根本不需要担心API - 您只需请求相关的json文件并使用您选择的语言对其进行解析.
这是一个示例URL,它将返回一个json对象,其中包含来自Justrolledintotheshop subreddit的热帖:https://www.reddit.com/r/Justrolledintotheshop/top.json
在顶部的地方,你可以使用hot,new或controversial.使用top时,您可以添加?t=day到网址的末尾以指定当天的热门帖子.其他有效值为hour,day,week,month,year,或all.
| 归档时间: |
|
| 查看次数: |
22858 次 |
| 最近记录: |