这是我的场景:
Microsoft.Azure.Storage.Blob 11.2.0
Microsoft.Azure.Storage.Queue 11.2.0
Micorosoft.Azure.Cosmos.Table 1.0.7
Run Code Online (Sandbox Code Playgroud)
我已经将很多代码从 Azure 函数转移到 Google k8s 和 Google Cloud,运行 Core .Net 应用程序,基本上使用 .net Standard 2.0 中内置的相同库,没有任何问题。
几天后,我注意到 Linux 系统中出现了不同的行为。与 Azure 服务(blob、表、队列)交互的调用很少会超时(子系统似乎失败了,我尝试了不同的重试策略,结果相同)。在 10,000 次调用中,我收到 10 到 50 个错误(或者在我更改超时之前很长的调用 180 秒)。这发生在所有 Azure 服务中:表、blob 和队列。
我尝试了不同的解决方案以找出原因:
在 azure 函数上运行相同的 dll 代码没有任何问题。
所以我得出的结论是,azure sdk 在内部使用的 http 客户端中有一些东西,这取决于您运行代码的操作系统。我想在几篇文章之后它可能是 Keep-Alive 标题,所以我尝试在我的组合根上:
ServicePointManager.SetTcpKeepAlive (true, 120000, 10000);
Run Code Online (Sandbox Code Playgroud)
但没有任何变化。
有什么想法或建议吗?...也许我走错了路,或者我错过了一些东西。