kam*_*aci 4 java twitter twitter4j
我正在开展一个项目,我将从一个在特定时间段内发布过推文的国家/地区获取所有推文.之后我会对它进行数据挖掘(检查对某个学生说了多少积极的想法等).我想用Java作为编程语言.但是我不知道如何开始这个项目.我做了一个搜索,我知道有:
我可以在一段时间内从一个国家(如果它可以来自某个国家)开始获取所有推文.一些示例如下:您正在提供用户名,如果是公共个人资料,则会返回推文.我没有所有公开个人资料的列表.我应该处理这个问题吗?
有任何想法吗?
如果你要使用Java Twitter4j是你最好的镜头.
但是你必须选择一种策略来检索你想要的推文.
您可以从Twitter本身获取数据,也可以从具有完整Firehose Access的数据提供程序获取数据.DataSift和Gnip是那些对Firehose有完全访问权限的提供者.如果你想使用数据提供者,DataSift是一种可行的方式,因为它有自己的查询语言,非常酷.
如果您自己检索数据.
首先,如果你想实时获取推文,你需要使用Twitter Streaming API和Twitter4j使它非常容易使用它.但不幸的是,Streaming API不支持国家或语言过滤.你可以听Streaming API进行搜索您注册的查询.
你的第二个选择是搜索API.Twitter4j也使得使用搜索API变得非常容易.搜索API支持更多的过滤选项.但是没有任何方法可以过滤国家的推文.但是根据语言的过滤而不是过滤推文更多有用的方法来做到这一点.例如,过滤en,fr等推文.
希望这可以帮助.