Mos*_*243 3 python twitter tweepy
我是Python和Tweepy的新手,我已经玩了一段时间了.我发现了这段代码.我一直用它来填充带有推文的Excel文件,效果很好.
但是我有几个问题:我可以使用这个循环获得多少推文?或者更具体地说,当我在过去几天获得第一个2000时,那些是否为我搜索的标签发布了所有推文?或者它与Streaming API相同,我可以获得所有推文的1%?
而且我真的不明白我的速度限制.使用上述代码获取10.000条推文需要多少查询?是每页100条推文,所以需要100页= 100次查询?
当我在最后几天获得第一个2000时,我搜索的标签是否发布了所有推文?或者它与Stream API相同,我可以获得所有推文的1%?
都不是.Twitter在过去两周内发布推文.但是,对于所有关键字,这都不相同:
Search API不是所有推文的完整索引,而是最近推文的索引.目前该索引包含6-9天的推文.
此外,无法保证所有最近的推文都被Twitter搜索API编入索引:
重要的是要知道Search API专注于相关性而非完整性.这意味着搜索结果中可能缺少某些推文和用户.
这些信息来自Twitter Search API的一般信息页面,这是一个很好的阅读,并将能够回答很多问题.
而且我真的不明白我的速度限制.使用上述代码获取10.000条推文需要多少查询?
Twitter API有一个图表,解释了不同资源的速率限制.价格限制为15分钟.对于搜索,每15分钟窗口有180个请求.由于每个请求可以获得100个计数,理论上你可以每15分钟收集180*100 = 18k个推文.但是,您只能收集Twitter提供的尽可能多的推文(请参阅6-9天的内容).您可以收集的推文数量取决于您的关键字和Twitter提供的内容.
| 归档时间: |
|
| 查看次数: |
1829 次 |
| 最近记录: |