C++套接字编程:最大化localhost上的吞吐量/带宽(我只获得3 Gbit/s而不是23GBit/s)

Chr*_*ian 4 c++ sockets bandwidth throughput

我想创建一个C++服务器/客户端,通过我的localhost上的TCP套接字通信最大化吞吐量.作为准备,我使用iperf找出i7 MacBookPro上的最大带宽.

------------------------------------------------------------
Server listening on TCP port 5001
TCP window size:  256 KByte (default)
------------------------------------------------------------
[  4] local 127.0.0.1 port 5001 connected with 127.0.0.1 port 51583
[  4]  0.0-120.0 sec   329 GBytes  23.6 Gbits/sec
Run Code Online (Sandbox Code Playgroud)

没有任何调整,ipref告诉我,我可以达到至少23.2 GBit/s.然后我做了我自己的C++服务器/客户端实现,你可以在这里找到完整的代码:https://gist.github.com/1116635

我的代码我基本上每次读/写操作传输一个1024bytes的int数组.所以我在服务器上的发送循环如下所示:

   int n;

   int x[256];

   //fill int array
   for (int i=0;i<256;i++)
   {
       x[i]=i;
   }

   for (int i=0;i<(4*1024*1024);i++)
   {
       n = write(sock,x,sizeof(x));
       if (n < 0) error("ERROR writing to socket");
   }
Run Code Online (Sandbox Code Playgroud)

我在客户端上的接收循环如下所示:

int x[256]; 

for (int i=0;i<(4*1024*1024);i++)
{
    n = read(sockfd,x,((sizeof(int)*256)));
    if (n < 0) error("ERROR reading from socket");
}
Run Code Online (Sandbox Code Playgroud)

正如在标题中提到的,运行它(使用-O3编译)会导致以下执行时间大约为3 GBit/s:

./client 127.0.0.1 1234
Elapsed time for Reading 4GigaBytes of data over socket on localhost: 9578ms
Run Code Online (Sandbox Code Playgroud)

我在哪里松开带宽,我做错了什么?再次,完整的代码可以在这里看到:https://gist.github.com/1116635

任何帮助表示赞赏!

CAF*_*FxX 5

  • 使用更大的缓冲区(即减少库/系统调用)
  • 使用异步API
  • 阅读文档(读/写的返回值不仅仅是一个错误条件,它还表示读/写的字节数)

  • 异步api在这种情况下真的有用吗?这只是一个简单的一对一沟通! (2认同)
  • @ArunMu最重要的事情无疑是降低了系统调用的数量(这就是为什么它是列表中的第一点).我列出了异步API,因为1)即使在如此简单的情况下它们也能帮助提高性能(如果使用得当)2)学习它们很好 (2认同)

cni*_*tar 3

我之前的回答是错误的。我已经测试了您的程序,这是结果。

  • 如果我运行原始客户端,我会得到0m7.763s
  • 如果我使用 4 倍大的缓冲区,我会得到0m5.209s
  • 缓冲区是原来的 8 倍,我得到0m3.780s

我只是换了客户端。我怀疑如果您还更改服务器,可能会压缩更多性能。

事实上,我得到的结果与你得到的结果完全不同(0m7.763svs 9578ms)也表明这是由执行的系统调用数量引起的(因为我们有不同的处理器......)。为了获得更高的性能:

  • 使用分散-聚集 I/O(readvwritev
  • 使用零拷贝机制splice(2)sendfile(2)