DCOM:如何在客户端崩溃时关闭服务器中的连接?

Ezh*_*Ezh 6 c++ dcom atl

我有一个相当古老的项目:DCOM客户端和服务器,都在C++\ATL中,只有Windows平台.一切正常:本地和远程客户端连接到服务器并同时工作没有任何问题.

但是当远程客户端崩溃或被任务管理器或"taskkill"命令或电源关闭杀死时 - 我遇到了问题.我的服务器对客户端崩溃一无所知,并尝试向所有客户端发送新事件(也已经崩溃).结果我有暂停(服务器无法向已经崩溃的客户端发送数据),它的持续时间与崩溃的远程客户端的数量成正比.在5次崩溃后,客户端暂停时间过长,等于完全服务器停止.

我知道DCOM"ping"机制(DCOM应该断开6分钟静默后不会响应"每2分钟ping一次"的客户端).实际上,经过6分钟的挂机后,我有一段时间的正常工作,但服务器又回到"暂停"状态.

我能做些什么呢?如何使DCOM"ping"工作正常?如果我将实现自己的"ping"代码,是否可以手动断开旧的DCOM客户端连接?怎么做?

bdo*_*lan 1

我不确定 DCOM ping 系统,但您的一个选择是将通知转移到单独的线程池。这将有助于减轻少量阻塞客户端的影响 - 当然,当阻塞客户端太多时,您就会开始遇到问题。

执行此操作的简单方法是使用QueueUserWorkItem- 这将调用应用程序系统线程池上传递的回调。假设您使用的是 MTA,这就是您需要做的:

static InfoStruct {
    IRemoteHost *pRemote;
    BSTR someData;
};

static DWORD WINAPI InvokeClientAsync(LPVOID lpInfo) {
  CoInitializeEx(COINIT_MULTITHREADED);

  InfoStruct *is = (InfoStruct *)lpInfo;
  is->pRemote->notify(someData);
  is->pRemote->Release();
  SysFreeString(is->someData);
  delete is;

  CoUninitialize();
  return 0;
}

void InvokeClient(IRemoteHost *pRemote, BSTR someData) {

  InfoStruct *is = new InfoStruct;
  is->pRemote = pRemote;
  pRemote->AddRef();

  is->someData = SysAllocString(someData);
  QueueUserWorkItem(InvokeClientAsync, (LPVOID)is, WT_EXECUTELONGFUNCTION);
}
Run Code Online (Sandbox Code Playgroud)

如果您的主线程位于 STA 中,则这只会稍微复杂一些;你只需要使用CoMarshalInterThreadInterfaceInStreamandCoGetInterfaceAndReleaseStream在公寓之间传递接口指针:

static InfoStruct {
    IStream *pMarshalledRemote;
    BSTR someData;
};

static DWORD WINAPI InvokeClientAsync(LPVOID lpInfo) {
  CoInitializeEx(COINIT_MULTITHREADED); // can be STA as well

  InfoStruct *is = (InfoStruct *)lpInfo;
  IRemoteHost *pRemote;
  CoGetInterfaceAndReleaseStream(is->pMarshalledRemote, __uuidof(IRemoteHost), (LPVOID *)&pRemote);

  pRemote->notify(someData);
  pRemote->Release();
  SysFreeString(is->someData);
  delete is;

  CoUninitialize();

  return 0;
}

void InvokeClient(IRemoteHost *pRemote, BSTR someData) {
  InfoStruct *is = new InfoStruct;
  CoMarshalInterThreadInterfaceInStream(__uuidof(IRemoteHost), pRemote, &is->pMarshalledRemote);

  is->someData = SysAllocString(someData);
  QueueUserWorkItem(InvokeClientAsync, (LPVOID)is, WT_EXECUTELONGFUNCTION);
}
Run Code Online (Sandbox Code Playgroud)

请注意,为了清楚起见,已省略错误检查 - 您当然希望对所有调用进行错误检查 - 特别是,您希望检查RPC_S_SERVER_UNAVAILABLE其他此类网络错误,并删除有问题的客户端。

您可能需要考虑一些更复杂的变体,包括确保每个客户端一次仅发出一个请求(从而进一步减少卡住客户端的影响)以及在 MTA 中缓存编组接口指针(如果您的主线程是STA)-因为我相信可能会执行网络请求,所以理想情况下,当您知道CoMarshalInterThreadInterfaceInStream客户端已连接时,您最好提前处理它,而不是冒着主线程阻塞的风险。