我使用twitter API来产生情绪.我正在尝试根据推文生成一个词云.
这是我生成wordcloud的代码
wordcloud(clean.tweets, random.order=F,max.words=80, col=rainbow(50), scale=c(3.5,1))
Run Code Online (Sandbox Code Playgroud)
结果如下:
我也试过这个:
pal <- brewer.pal(8,"Dark2")
wordcloud(clean.tweets,min.freq = 125,max.words = Inf,random.order = TRUE,colors = pal)
Run Code Online (Sandbox Code Playgroud)
结果如下:
我错过了什么吗?
这就是我收到和清理推文的方式:
#downloading tweets
tweets <- searchTwitter("#hanshtag",n = 5000, lang = "en",resultType = "recent")
# removing re tweets
no_retweets <- strip_retweets(tweets , strip_manual = TRUE)
#converts to data frame
df <- do.call("rbind", lapply(no_retweets , as.data.frame))
#remove odd characters
df$text <- sapply(df$text,function(row) iconv(row, "latin1", "ASCII", sub="")) #remove emoticon
df$text = gsub("(f|ht)tp(s?)://(.*)[.][a-z]+", "", df$text) #remove URL
sample <- df$text
# …Run Code Online (Sandbox Code Playgroud) 我想访问Twitter的存档,而不受速率限制或查询数量的限制。我不介意为此付费,因此我的计划是在Twitter的API平台上注册高级软件包。正如我熟悉Tweepy一样,我希望能够以通常的方式访问API。
但是,似乎我可以在Python中使用高级凭证查询API的唯一方法是通过Python Twitter Search API,它基本上是高级服务的python包装器。问题在于,高级访问的身份验证协议与限速免费访问的身份验证协议不同。这很烦人,因为searchtweets支持Python Twitter Search API 的库似乎相当原始,我几乎对这些文档毫无意义。
有谁知道是否可以使用Tweepy来访问Twitter的高级会员?奇怪的是,更好的工具只能在免费层上使用。
几天前,由于GDPR的变化,Twitter更新了其API的某些方面.从今天开始,我的一些应用程序已经以非常奇怪的方式打破了,我没想到会受到GDPR更改的影响.也许它与这些变化无关,但它是神秘的时机,因为他们几天前改变了API,现在我正在打破.我从速度限制终点得到的回报,就像我以前的2-3天前一样.
我正在使用python和twitter-application-only-auth == 0.3.3库,特别是我可以登录并创建客户端(所以我的令牌和权限仍然很好)但是当我做的时候
client = Client(twitter_consumer_key, twitter_consumer_secret)
url = "https://api.twitter.com/1.1/application/rate_limit_status.json?resources=help,users,search,statuses"
print client.request( url)
Run Code Online (Sandbox Code Playgroud)
我回来了
{u'rate_limit_context': {u'application': u'AZljARxCJ6b4rPtCGJIuk4O'}, u'resources': {}}
Run Code Online (Sandbox Code Playgroud)
资源空的地方.我看不到每个端点剩余多少API调用,这导致我的应用程序出现问题.我没有看到任何关于此端点应该更改的内容:https://developer.twitter.com/en/docs/developer-utilities/rate-limit-status/api-reference/get-application-rate_limit_status.html
我可以打其他电话.例如
client.request("https://api.twitter.com/1.1/users/lookup.json?screen_name=twitter")
Run Code Online (Sandbox Code Playgroud)
按预期工作并返回数据....其他任何有这个问题围绕速率限制api端点?难道我做错了什么?
我的挑战是获取拥有超过 3000 万粉丝的帐户的所有粉丝列表。
目前,我正在 Twitter 的 REST API 上使用GET followers/list端点,但是,由于免费 API 的速率限制,这需要很多天才能实现。
我愿意为高级 API 访问付费,但是我找不到任何数据表明高级 API 具有必要的端点和足够的速率限制来帮助最多在几个小时内解决此任务。
对此事有任何见解将不胜感激......