关于GAE的Twitter流媒体

1my*_*myb 5 python twitter google-app-engine stream python-2.7

为什么我会收到此错误?这就是我如何调用流API.

import tweepy
import sys

creds = json.loads(open('credential.json').read())
tw_consumer_key = creds['tw_consumer_key']
tw_consumer_secret = creds['tw_consumer_secret']
tw_access_token = creds['tw_access_token']
tw_access_token_secret = creds['tw_access_token_secret']

try:
    auth = tweepy.OAuthHandler(tw_consumer_key, tw_consumer_secret)
    auth.set_access_token(tw_access_token, tw_access_token_secret)
    api = tweepy.API(auth)
except Exception:
    service = None
    api = None    

# Query terms
Q = "Better"

class CustomStreamListener(tweepy.StreamListener):
    def on_status(self, status):
        try:
            print "%s\n%s\n%s\n%s\n\n" % (status.text, 
                                      status.author.screen_name, 
                                      status.created_at, 
                                      status.source,)
        except Exception, e:
            print >> sys.stderr, 'Encountered Exception:', e
            pass

    def on_error(self, status_code):
        print >> sys.stderr, 'Encountered error with status code:', status_code
        return True # Don't kill the stream

    def on_timeout(self):
        print >> sys.stderr, 'Timeout...'
        return True # Don't kill the stream



class LiveStream(webapp2.RequestHandler):
    def get(self):
        streaming_api = tweepy.streaming.Stream(auth, CustomStreamListener(), timeout=60)
        self.response.out.write(streaming_api.filter(track=Q))
Run Code Online (Sandbox Code Playgroud)

可能由GAE引起的不允许套接字,我不知道如何应用查询术语来获取特定的过滤流式推文.这部分代码的目的是获取指定关键字的实时流.如果有其他方法,请指导.

tes*_*dal 3

在 App Engine 上,httplib 连接(和 urllib)将使用 Google URL 获取服务。URL Fetch 服务意味着其他服务器(不是应用程序引擎服务实例)执行请求并将响应返回到应用程序引擎实例,而不是进程本身打开套接字。

我相信您注意到在 GAE 上运行的 httplib 变体不提供用于设置超时的 sock 属性。但根本问题是无法获取流,在响应完成之前您不会将任何结果返回到应用程序引擎中。我还没有测试它是如何失败的,但我预计您会从 URL 服务收到 DeadlineExceededError,因为 Twitter 不会关闭流响应。

目前没有其他方法可以在 GAE 上获取流。它可能与后端的出站套接字支持一起使用。套接字支持目前仅适用于测试人员。

  • [此处](https://docs.google.com/spreadsheet/viewform?formkey=dF9QR3pnQ2pNa0dqalViSTZoenVkcHc6MQ#gid=0) 是出站套接字的注册表单。正如 @tesdal 所说,目前无法在 GAE 上建立长期连接。我见过使用简单 UrlFetch 的应用程序,但任务队列的截止日期很长。但即使你让它发挥作用,它也违反了 Twitter 的 Stream API 政策。 (2认同)