twitter4j - 从Streaming API访问推文信息

And*_*rew 5 twitter twitter4j

我的目标是收集包含"法国"和"德国"字样的所有推文,并收集相关的元数据(例如,附在推文上的地理坐标).我知道这个元数据是可用的,但我无法弄清楚如何使用我正在使用的Java库访问它:"twitter4j".

好吧,所以我到目前为止从twitter4j网站上的代码示例中获取.它打印出包含我所选关键字的所有推文,因为它们是由Twitter的Streaming API实时提供的.我在我的TwitterStream对象上调用filter方法,这提供了流.但我需要更多控制权.也就是说,我希望能够:

1)将推文写入文件; 2)只打印前1000条推文; 3)访问附加到推文的其他元数据(过滤方法只打印出用户名和推文本身).

这是我到目前为止的代码:

import twitter4j.FilterQuery;
import twitter4j.Status;
import twitter4j.StatusDeletionNotice;
import twitter4j.StatusListener;
import twitter4j.TwitterException;
import twitter4j.TwitterStream;
import twitter4j.TwitterStreamFactory;
import twitter4j.conf.ConfigurationBuilder;

public class Stream {
    public static void main(String[] args) throws TwitterException {

    ConfigurationBuilder cb = new ConfigurationBuilder();
    cb.setDebugEnabled(true);
    cb.setOAuthConsumerKey("bbb");
    cb.setOAuthConsumerSecret("bbb");
    cb.setOAuthAccessToken("bbb");
    cb.setOAuthAccessTokenSecret("bbb");

    TwitterStream twitterStream = new TwitterStreamFactory(cb.build()).getInstance();
    StatusListener listener = new StatusListener() {

        public void onStatus(Status status) {
            System.out.println("@" + status.getUser().getScreenName() + " - " + status.getText());
        }

        public void onDeletionNotice(StatusDeletionNotice statusDeletionNotice) {
            System.out.println("Got a status deletion notice id:" + statusDeletionNotice.getStatusId());
        }

        public void onTrackLimitationNotice(int numberOfLimitedStatuses) {
            System.out.println("Got track limitation notice:" + numberOfLimitedStatuses);
        }

        public void onScrubGeo(long userId, long upToStatusId) {
            System.out.println("Got scrub_geo event userId:" + userId + " upToStatusId:" + upToStatusId);
        }

        public void onException(Exception ex) {
            ex.printStackTrace();
        }
    };

    FilterQuery fq = new FilterQuery();
    String keywords[] = {"France", "Germany"};

    fq.track(keywords);

    twitterStream.addListener(listener);
    twitterStream.filter(fq);      
}
}
Run Code Online (Sandbox Code Playgroud)

And*_*rew 5

在用新鲜的眼睛看着这个之后,我意识到了解决方案(这很明显).编辑以下代码部分:

public void onStatus(Status status) {
        System.out.println("@" + status.getUser().getScreenName() + " - " + status.getText());
    }
Run Code Online (Sandbox Code Playgroud)

允许我访问其他元数据.例如,如果我想访问推文的日期,我只需要添加以下内容:

System.out.println(status.getCreatedAt());
Run Code Online (Sandbox Code Playgroud)