在r中使用twitteR排除刮取转发

Wig*_*ust 2 twitter r web-scraping

我正在使用r v.1.0.44和twitteR(最新版本)软件包基于某些关键字来搜索推文.具体来说,我使用以下命令:

 my_twitter_data  <- searchTwitter("#aleppo", n = 40000, lang = "en", since =    '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120) 
Run Code Online (Sandbox Code Playgroud)

在请求关于#aleppo的40k推文(由于速率限制需要相当长的时间)时,只有5k的结果将是原始推文, strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE)即将返回长度为5k的列表.

我的问题是我花了很多时间限制因此转发的时间与我的进一步分析无关.我的问题是,如果在R中有这种方法解决这个问题,那么我只对原始推文花费我的速率限制吗?

sin*_*eso 6

您可以添加-filter:retweets到您的查询:

 my_twitter_data <- searchTwitter("#aleppo -filter:retweets", n = 40000,
                                  lang = "en", since = '2016-12-12',
                                  until = "2016-12-13", retryOnRateLimit = 120)
Run Code Online (Sandbox Code Playgroud)