Kev*_*ski 0 concurrency google-cloud-platform google-cloud-run
我创建了一个新的云运行服务,设置为每秒 50 个最大请求(并发),但在生产中它一直徘徊在最大 2-3 个请求/秒/容器。我知道 cloud run 的目标是将 CPU 保持在 60% 左右,但我已经将其从 1 个 vCPU 增加到 4 个 vCPU,但我仍然没有看到我现在期望的 0.75 req/s 负载所需的 1 个容器。我尝试了“始终分配”CPU,但它并没有减少活动实例数。
到底是怎么回事?有什么办法可以让它坚持我设定的最大值吗?如果继续这样扩展,将会额外花费数百美元,因为我什至还没有打开所有请求。
替代问题:由于成本仅在请求分配期间产生,也许我不需要付费,并且活动容器的数量并不重要?
PS:这是一个无头抓取服务,因此它将运行无头 chrome,这需要大量的 CPU 才能启动,但每个额外的选项卡都不会大幅增加 CPU 要求。
PSS:此外,任何有关保持容器数量较低的建议建议都值得赞赏:我添加了最小活动实例 1,但这就是我考虑的全部内容。