std :: string移动构造函数实际上是移动的吗?

too*_*zzy 21 c++ move stdstring move-semantics c++11

所以这里有一个小测试程序:

#include <string>
#include <iostream>
#include <memory>
#include <vector>

class Test
{
public:
  Test(const std::vector<int>& a_, const std::string& b_)
    : a(std::move(a_)),
      b(std::move(b_)),
      vBufAddr(reinterpret_cast<long long>(a.data())),
      sBufAddr(reinterpret_cast<long long>(b.data()))
  {}

  Test(Test&& mv)
    : a(std::move(mv.a)),
      b(std::move(mv.b)),
      vBufAddr(reinterpret_cast<long long>(a.data())),
      sBufAddr(reinterpret_cast<long long>(b.data()))
  {}

  bool operator==(const Test& cmp)
  {
    if (vBufAddr != cmp.vBufAddr) {
      std::cout << "Vector buffers differ: " << std::endl
        << "Ours: " << std::hex << vBufAddr << std::endl
        << "Theirs: " << cmp.vBufAddr << std::endl;
      return false;
    }

    if (sBufAddr != cmp.sBufAddr) {
      std::cout << "String buffers differ: " << std::endl
        << "Ours: " << std::hex << sBufAddr << std::endl
        << "Theirs: " << cmp.sBufAddr << std::endl;
      return false;
    }
  }

private:

  std::vector<int> a;
  std::string b;
  long long vBufAddr;
  long long sBufAddr;
};

int main()
{
  Test obj1 { {0x01, 0x02, 0x03, 0x04}, {0x01, 0x02, 0x03, 0x04}};
  Test obj2(std::move(obj1));

  obj1 == obj2;


  return 0;
}
Run Code Online (Sandbox Code Playgroud)

我用于测试的软件:

编译器:gcc 7.3.0

编译器标志:-std = c ++ 11

操作系统:Linux Mint 19(tara)上行版Ubuntu 18.04 LTS(仿生)

我在这里看到的结果是,移动后,矢量缓冲区仍然具有相同的地址,但字符串缓冲区不具有相同的地址.因此,在我看来,它分配了新的,而不是仅仅交换缓冲区指针.是什么导致这种行为?

Sha*_*ger 36

您可能会看到小/短字符串优化的影响.为了避免对每个微小的字符串进行不必要的分配,许多实现std::string包括一个小的固定大小的数组来保存小字符串而不需要new(这个数组通常会重新利用一些其他成员,这些成员在没有使用动态分配时是不必要的,所以无论是小型还是大型,它都消耗很少或不需要额外的内存string,而且这些字符串不会受益std::move(但它们很小,所以没关系).较大的字符串将需要动态分配,并将按预期传输指针.

仅供演示,此代码g++:

void move_test(std::string&& s) {
    std::string s2 = std::move(s);
    std::cout << "; After move: " << std::hex << reinterpret_cast<uintptr_t>(s2.data()) << std::endl;
}

int main()
{
    std::string sbase;

    for (size_t len=0; len < 32; ++len) {
        std::string s1 = sbase;
        std::cout << "Length " << len << " - Before move: " << std::hex << reinterpret_cast<uintptr_t>(s1.data());
        move_test(std::move(s1));
        sbase += 'a';
    }
}
Run Code Online (Sandbox Code Playgroud)

在线尝试!

产生高(堆栈)地址,在移动结构上改变长度为15或更小(可能随架构指针大小而变化),但切换到低(堆)地址,一旦你达到16或更高的长度(移动开关),移动构造后保持不变是16,而不是17,因为它是 - NUL终止字符串,因为C++ 11和更高版本需要它).

要100%明确:这是一个实现细节.C++规范的任何部分都不需要这种行为,所以你不应该完全依赖它,当它发生时,你不应该依赖于特定字符串长度.

  • *"包含一个小的固定大小的数组来保存小字符串"* - 你通常不包括一个SSO数组,但你重复使用可用的存储空间(大小/指针/ ...)并添加一个标志来表明你是否有一个短串. (4认同)
  • @Holt:也就是说,你使用一个有区别的`union`,它包含一个`char [N]`用于短字符串.所以数组就在那里,即使它可能不存在于所有对象中. (4认同)
  • @Holt:当然,但效果与OP的目的相同.就此而言,如果您将截止值设置为严格的长度/容量限制(如果您只是将数据推送到指针成员中,则无论如何都会受到限制),则不需要专用标志. (2认同)
  • @Ruslan:看起来像.我刚刚检查了GCC 8的标题,它只是定义了一个`enum`常量`_S_local_capacity = 15/sizeof(_CharT)`,然后定义了`union {_CharT _M_local_buf [_S_local_capacity + 1]; size_type _M_allocated_capacity; 所以它实际上保留了一个固定的16字节,其容量与`size_type`结合在一起,这意味着SSO数组比它共享的成员大8-12个字节.32位`string`较小(`sizeof`报告24个字节,而64位`string`则为32),但我猜测它可能是32位为12位而24位是64位而没有SSO. (2认同)