如何在R中的twitteR包中提取tweet地理编码

Question

如何在R中的twitteR包中提取tweet地理编码

最近,Edwin Chen发布了一张关于苏打水与流行的区域使用情况以及通过地理编码推文在饮酒方面解决这些词语的焦炭的精彩地图.http://blog.echen.me/2012/07/06/soda-vs-pop-with-twitter/

他提到,他所使用的杰夫·金特里在R.果然创建Twitter的包,很容易收集使用给定词的鸣叫,把他们在一个数据帧:

require(twitteR)
require(plyr)
cat.tweets<-searchTwitter("cats",n=1000)
tweets.df = ldply(cat.tweets, function(t) t$toDataFrame() )

Run Code Online (Sandbox Code Playgroud)

dataframe(tweets.df)将包含每条推文的用户ID,推文文本等,但似乎不包含地理编码.关于如何在R中获得它的任何想法？

Answer 1

not*_*tar 2

这是一个玩具示例，假设每次调用只能提取 100 条推文：

require(twitteR)
require(plyr)
URL = paste('http://search.twitter.com/search.atom? 
      q=','&geocode=39.724089,-104.820557,3mi','&rpp=100&page=', page, sep='') #Aurora,CO with radii of 3mi
XML = htmlTreeParse(URL, useInternal=TRUE)
entry = getNodeSet(XML, "//entry")
tweets = c()

for (i in 1:99){ 
    t = unlist(xpathApply(entry[[i]], "//title", xmlValue))
    tweets = c(tweets,t)
}

Run Code Online (Sandbox Code Playgroud)

这个解决方案可能不太优雅，但我能够根据特定的地理编码获取推文。

归档时间：	13 年，6 月前
查看次数：	15687 次
最近记录：	11 年，3 月前