对于具有大量来宾可执行应用程序的群集,应在 Service Fabric Placement/Load balance 配置中设置哪些阈值?
我在 Service Fabric 尝试将太多服务放置到单个节点上的速度过快时遇到了问题。
举一个集群大小的例子,有 2-4 个工作节点类型,每个节点类型有 3-6 个工作节点,每个节点类型可以运行 200 个来宾可执行应用程序,每个应用程序至少有 2 个副本。节点在运行时能够运行服务,只是 CPU 过高的启动时间。
问题似乎是集群配置中设置的放置和负载平衡规则的阈值或默认值。作为我尝试过的示例:我已打开InBuildThrottlingEnabled并设置InBuildThrottlingGlobalMaxValue为100,我已将 Global Movement Throttle 设置设置为总应用程序计数的不同百分比。
在这一点上,我试图解决两种不同的情况。在这两种情况下,节点都会在一段时间内达到 100%,以便服务结构声明节点已关闭。
第一:从关闭的所有节点启动整个集群,而不会出现大量节点。
第二:单个节点在主机恢复联机后启动的服务过多而不堪重负
这是我在集群上的当前参数:
"Name": "PlacementAndLoadBalance",
“参数”: [
{
"Name": "UseMoveCostReports",
“值”:“真”
},
{
"Name": "PLBRefreshGap",
“值”:“1”
},
{
"Name": "MinPlacementInterval",
“价值”:“30.0”
},
{
"Name": "MinLoadBalancingInterval",
“价值”:“30.0”
},
{
"Name": "MinConstraintCheckInterval",
“价值”:“30.0”
},
{
"Name": "GlobalMovementThrottleThresholdForPlacement",
“价值”:“25”
},
{
"Name": "GlobalMovementThrottleThresholdForBalance",
“价值”:“25”
},
{
"Name": "GlobalMovementThrottleThreshold",
“价值”:“25” …