使用 TMB 生成目标函数和梯度并调用该optim函数后,我在控制台中打印出一系列报告,其形式似乎为“outer mgc:”:
outer mgc: 56.54273
outer mgc: 56.51064
outer mgc: 56.96065
outer mgc: 57.13384
outer mgc: 29.01959
outer mgc: 27.08267
outer mgc: 25.99866
outer mgc: 25.79068
outer mgc: 25.58621
outer mgc: 21.91722
outer mgc: 21.73952
outer mgc: 21.56449
outer mgc: 21.52924
outer mgc: 21.52189
outer mgc: 21.19551
outer mgc: 20.7331
outer mgc: 16.39087
outer mgc: 11.35111
outer mgc: 10.61466
outer mgc: 6.748524
outer mgc: 1.420802
outer mgc: 0.1197647
Run Code Online (Sandbox Code Playgroud)
看起来数字越小表明收敛速度越快,收敛结果也越好。但我并不完全确定这些是什么,因此很高兴知道这些是什么,以便诊断算法的收敛特性。
缩写 mgc 代表“最大梯度分量”。
对于每个参数,TMB 估计一个梯度(偏导数),优化后您可以通过运行 obj$gr(opt$par) 获得该梯度。所有这些都应尽可能接近于零。因此,为了使模型正常,最高或最大(距零最远)应该仍然很低。您会注意到,使用 sdreport() 时,还会给出最终的最大梯度分量。使用 nlminb/optim 时,每次迭代默认也会计算并打印这些梯度(除非 makeADfun 中的silent=TRUE)。