Jef*_*ffG 12 python tornado long-polling
使用Tornado,我有一个Get请求需要很长时间,因为它向另一个Web服务发出许多请求并处理数据,可能需要几分钟才能完全完成.我不希望这阻止整个Web服务器响应其当前所做的其他请求.
据我了解,Tornado是单线程并同步执行每个请求,即使它异步处理它们(仍然在那个位置上混淆).长进程的某些部分可能是暂停点,以允许服务器处理其他请求(可能的解决方案?).我在Heroku上运行它只有一个工作者,所以不确定如何转换为产生一个新的线程或多处理,我没有使用python的经验.
这里是我想要做的事:客户端发出GET调用来启动进程,那么我通过循环另一个get调用每5秒检查状态,并用新信息更新页面(长轮询也将工作,但运行进入同一问题).问题是启动长进程会阻止所有新的get请求(或新的长轮询会话),直到它完成为止.
是否有一种简单的方法可以启动这个长时间的呼叫,而不是让它在整个过程中阻止整个Web服务器?有没有什么我可以在代码中说.."暂停,处理待处理的请求然后继续"?
我需要在ProcessHandler上发起get请求.然后我需要继续能够在ProcessHandler运行时查询StatusHandler.
例:
class StatusHandler(tornado.web.RequestHandler):
@tornado.web.asynchronous
def get(self):
self.render("status.html")
class ProcessHandler(tornado.web.RequestHandler):
@tornado.web.asynchronous
def get(self):
self.updateStatus("0")
result1 = self.function1()
self.updateStatus("1")
result2 = self.function2(result1)
self.updateStatus("2")
result3 = self.function3(result2)
self.updateStatus("3")
self.finish()
Run Code Online (Sandbox Code Playgroud)
kob*_*las 18
这是一个完整的样本Tornado应用程序,它使用Async HTTP客户端和gen.Task模块来简化操作.
如果您gen.Task在文档中阅读更多信息,您会发现您实际上可以同时分派多个请求.这是使用Tornado的核心理念,其中一切都没有阻塞,仍然保持一个单一的过程.
更新:我添加了一个Thread处理程序来演示如何将工作分配到第二个线程并在callback()完成时接收它.
import os
import threading
import tornado.options
import tornado.ioloop
import tornado.httpserver
import tornado.httpclient
import tornado.web
from tornado import gen
from tornado.web import asynchronous
tornado.options.define('port', type=int, default=9000, help='server port number (default: 9000)')
tornado.options.define('debug', type=bool, default=False, help='run in debug mode with autoreload (default: False)')
class Worker(threading.Thread):
def __init__(self, callback=None, *args, **kwargs):
super(Worker, self).__init__(*args, **kwargs)
self.callback = callback
def run(self):
import time
time.sleep(10)
self.callback('DONE')
class Application(tornado.web.Application):
def __init__(self):
handlers = [
(r"/", IndexHandler),
(r"/thread", ThreadHandler),
]
settings = dict(
static_path = os.path.join(os.path.dirname(__file__), "static"),
template_path = os.path.join(os.path.dirname(__file__), "templates"),
debug = tornado.options.options.debug,
)
tornado.web.Application.__init__(self, handlers, **settings)
class IndexHandler(tornado.web.RequestHandler):
client = tornado.httpclient.AsyncHTTPClient()
@asynchronous
@gen.engine
def get(self):
response = yield gen.Task(self.client.fetch, "http://google.com")
self.finish("Google's homepage is %d bytes long" % len(response.body))
class ThreadHandler(tornado.web.RequestHandler):
@asynchronous
def get(self):
Worker(self.worker_done).start()
def worker_done(self, value):
self.finish(value)
def main():
tornado.options.parse_command_line()
http_server = tornado.httpserver.HTTPServer(Application())
http_server.listen(tornado.options.options.port)
tornado.ioloop.IOLoop.instance().start()
if __name__ == "__main__":
main()
Run Code Online (Sandbox Code Playgroud)
科布拉斯的解决方案很棒.这是一个利用tornado.gen的替代方案
import tornado.ioloop
import tornado.web
import tornado.gen
import tornado.concurrent
import time
from threading import Thread
from functools import wraps
def run_async(func):
@wraps(func)
def async_func(*args, **kwargs):
func_hl = Thread(target = func, args = args, kwargs = kwargs)
func_hl.start()
return func_hl
return async_func
@run_async
def sleeper(callback):
i = 0
while i <= 10:
print i
time.sleep(1)
i += 1
callback('DONE')
class MainHandler(tornado.web.RequestHandler):
@tornado.web.asynchronous
@tornado.gen.coroutine
def get(self):
response = yield tornado.gen.Task(sleeper)
self.write(response)
self.finish()
class OtherHandler(tornado.web.RequestHandler):
def get(self):
self.write('hello world')
print 'in other'
self.finish()
Run Code Online (Sandbox Code Playgroud)