Passenger使用比预期更多的PostgreSQL连接

Question

生产中存在很长时间的难题,我们不知道它来自何处.有时候可以在localhost上重现它,Heroku Enterprise支持一直没有这个.

在我们的生产数据库中,我们目前有以下设置:

a SELECT * FROM pg_stat_activity GROUP BY client_addr并计算每个实例的连接数,表明在高峰期间为一个客运进程打开了超过1个PSQL连接.

假设:

这是一个截图SELECT * FROM pg_stat_activity;:

在屏幕截图中,我们可以看到有45个psql连接来自同一个运行乘客的dyno.如果我们遵循先前的逻辑,那么每个乘客流程不应该有超过1个连接,所以25.

日志看起来并不寻常,没有提到dyno崩溃/进程崩溃.

以下是相同dyno的乘客状态的屏幕截图(不同的时间,只是为了证明没有比为一个dyno创建的25个更多的进程):

最后我们从Heroku支持获得了一个响应(惊人的支持btw)

我还看到之前有关乘客利用比预期更多连接的报告,但不幸的是,大多数人因复制困难而被关闭.

在Passenger文档中,解释了Passenger自己处理ActiveRecord连接.

任何线索赞赏.谢谢!

各种信息:

如果您需要更多信息,请在评论中告诉我,我很乐意更新这篇文章.

最后一件事:我们使用ActionCable.我读过某个地方乘客正在处理奇怪的套接字连接(打开一个隐藏的过程以保持连接活着).这是我们的一个主角,但到目前为止,没有运气在localhost上重现它.如果任何人都可以确认Passenger如何处理ActionCable连接,那将非常感激.

更新1(01/10/2018):

尝试:

禁用NewRelic自动解释功能,如下所述:https://devcenter.heroku.com/articles/forked-pg-connections#disabling-new-relic-explain
在本地运行最小和最大池大小设置为3的Passenger服务器(更多会使我的计算机刻录),然后使用各种信号(SIGKILL,SIGTERM)终止进程以尝试查看连接是否正确关闭.他们是.

Answer 1

我们终于成功解决了 Passenger 上的问题。实际上我们已经有这个问题很长时间了。

修复

如果您使用 ActionCable，并且您的默认电缆路线是/cable，则将 Procfile 更改为：

web: bundle exec passenger start -p $PORT --max-pool-size $PASSENGER_MAX_POOL_SIZE

到

web: bundle exec passenger start -p $PORT --max-pool-size $PASSENGER_MAX_POOL_SIZE --unlimited-concurrency-path /cable

解释

在更改之前，每个套接字连接 (ActionCable) 将在 Passenger 中占用一个进程。但Socket实际上是不应该占用整个过程的东西。一个进程可以处理很多很多打开的套接字连接。（对于一些大牌来说，很多是同时超过一万）。幸运的是，我们的套接字连接要少得多，但仍然如此。

更改后，我们基本上告诉 Passenger 不要使用整个进程来处理一个套接字连接，而是专门使用整个进程来处理所有套接字连接。

文档

修复三周后的一些指标