为什么 std::string_view 比 const char* 快?

uni*_*uni 5 c++ optimization benchmarking string-view

还是我在测量别的东西?

在这段代码中,我有一堆标签 ( integers)。每个标签都有一个字符串表示(const char*std::string_view)。在循环堆栈值被转换为相应的字符串值。这些值附加到预先分配的字符串或分配给数组元素。

结果表明,带有std::string_view的版本比带有 的版本稍快const char*

代码:

#include <array>
#include <iostream>
#include <chrono>
#include <stack>
#include <string_view>

using namespace std;

int main()
{
    enum Tag : int { TAG_A, TAG_B, TAG_C, TAG_D, TAG_E, TAG_F };
    constexpr const char* tag_value[] = 
        { "AAA", "BBB", "CCC", "DDD", "EEE", "FFF" };
    constexpr std::string_view tag_values[] =
        { "AAA", "BBB", "CCC", "DDD", "EEE", "FFF" };

    const size_t iterations = 10000;
    std::stack<Tag> stack_tag;
    std::string out;
    std::chrono::steady_clock::time_point begin;
    std::chrono::steady_clock::time_point end;

    auto prepareForBecnhmark = [&stack_tag, &out](){
        for(size_t i=0; i<iterations; i++)
            stack_tag.push(static_cast<Tag>(i%6));
        out.clear();
        out.reserve(iterations*10);
    };

// Append to string
    prepareForBecnhmark();
    begin = std::chrono::steady_clock::now();
    for(size_t i=0; i<iterations; i++) {
        out.append(tag_value[stack_tag.top()]);
        stack_tag.pop();
    }
    end = std::chrono::steady_clock::now();
    std::cout << out[100] << "append string const char* = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;

    prepareForBecnhmark();
    begin = std::chrono::steady_clock::now();
    for(size_t i=0; i<iterations; i++) {
        out.append(tag_values[stack_tag.top()]);
        stack_tag.pop();
    }
    end = std::chrono::steady_clock::now();
    std::cout << out[100] << "append string string_view= " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;

// Add to array
    prepareForBecnhmark();
    std::array<const char*, iterations> cca;
    begin = std::chrono::steady_clock::now();
    for(size_t i=0; i<iterations; i++) {
        cca[i] = tag_value[stack_tag.top()];
        stack_tag.pop();
    }
    end = std::chrono::steady_clock::now();
    std::cout << "fill array const char* = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;

    prepareForBecnhmark();
    std::array<std::string_view, iterations> ccsv;
    begin = std::chrono::steady_clock::now();
    for(size_t i=0; i<iterations; i++) {
        ccsv[i] = tag_values[stack_tag.top()];
        stack_tag.pop();
    }
    end = std::chrono::steady_clock::now();
    std::cout << "fill array string_view = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
    std::cout << ccsv[ccsv.size()-1] << cca[cca.size()-1] << std::endl;

    return 0;
}
Run Code Online (Sandbox Code Playgroud)

我机器上的结果是:

Aappend string const char* = 97[µs]
Aappend string string_view= 72[µs]
fill array const char* = 35[µs]
fill array string_view = 18[µs]
Run Code Online (Sandbox Code Playgroud)

Godbolt 编译器资源管理器网址:https ://godbolt.org/z/SMrevx

UPD:更准确的基准测试后的结果(500 次运行 300000 次迭代):

Caverage append string const char* = 2636[µs]
Caverage append string string_view= 2096[µs]
average fill array const char* = 526[µs]
average fill array string_view = 568[µs]
Run Code Online (Sandbox Code Playgroud)

Godbolt 网址:https ://godbolt.org/z/aU7zL_

所以在第二种情况下const char*比预期的要快。第一种情况在答案中进行了解释。

Pau*_*ans 11

仅仅是因为随着std::string_view您传递了长度,并且每当您想要一个新字符串时,您都不必插入空字符。每次char*都必须搜索结尾,如果你想要一个子字符串,你可能必须复制,因为你需要在子字符串的末尾有一个空字符。

  • @uni:如果你先对另一个进行基准测试,这些数字会改变吗?您的总基准测试结束得如此之快,以至于 CPU 可能会在那时加速到最大睿频。或者第一个数组比第二个数组付出更多的页错误成本。TL:DR:您的结果的这一部分可能归因于简单的微基准测试方法。 (2认同)

mid*_*dor 8

std::string_view出于实际目的,归结为:

{
  const char* __data_;
  size_t __size_;
}
Run Code Online (Sandbox Code Playgroud)

该标准实际上以秒为单位指定。24.4.2 表明这是一个指针和大小。它还指定某些操作如何与字符串视图配合使用。最值得注意的是,每当您与之交互时,std::string您都会调用也将大小作为输入的重载。因此,当您调用append时,这可以归结为两个不同的调用:str.append(sv)转换为str.append(sv.data(), sv.size()).

显着的区别是,您现在知道后的字符串的大小append,这意味着您还知道是否需要重新分配内部缓冲区以及必须将其设置为多大。如果您事先不知道大小,则可以开始复制,但为std::string提供了强有力的保证append,因此出于实际目的,大多数库会预先计算重载中的长度char*,尽管从技术上讲,也可以只记住旧大小如果您没有成功完成,则擦除所有内容(怀疑有人这样做,尽管这可能是字符串的本地优化,因为破坏是微不足道的)。