如何从 Twitter API 中提取历史推文?

use*_*893 -5 python api twitter r web

我们需要一些电影的历史推文。现在,我们尝试了 twitter 的流 API 和搜索 API。流 API 不能给我们一个参数来选择我们需要的时间范围,搜索 API 只能提前一两周给我们数据。有没有办法提取2014-05-01到2014-07-01的历史推文(例如)?我发现以下方法可以做到这一点:

1:推特高级搜索 https://twitter.com/search-advanced?lang=en 可以找到我需要的搜索结果。但是我怎么能下载搜索结果呢?反正有没有写代码并保存搜索结果?

2:像topsy一样使用推特分析网站。但它也有保存结果的困难。

3:似乎像 twitter4J 这样的一些包可以帮助解决这个问题:http : //twitter4j.org/en/code-examples.html 有没有任何 python 或 R 包可以帮助我们做到这一点?

4:我们需要这些数据来做研究。花费很长时间来提取数据并不是一个好的选择。反正有没有从一些专业网站购买这些数据?

pra*_*nth 5

您可以使用以下库https://github.com/Jefferson-Henrique/GetOldTweets-python在 Twitter 中获取旧推文。

使用 GetOldTweets-python 作为 Python 中的当前目录

 cd GetOldTweets-python
Run Code Online (Sandbox Code Playgroud)

然后执行以下操作

在 Python 中,

import got
tweetCriteria = got.manager.TweetCriteria().setQuerySearch('search_term').setSince("2014-05-01").setUntil("2014-07-01").setMaxTweets(10000)
tweet = got.manager.TweetManager.getTweets(tweetCriteria)[0]

print tweet.text
Run Code Online (Sandbox Code Playgroud)

在终端,

python Exporter.py --querysearch 'search_term' --since 2014-05-01 --until 2014-07-01 --maxtweets 10000
Run Code Online (Sandbox Code Playgroud)

用搜索词替换“search_term”。