使用ThreadStatic取代昂贵的本地人 - 好主意?

Dan*_*Tao 15 .net optimization performance multithreading threadstatic

更新:正如我所预料的那样,社区对此问题提出的合理建议是"衡量和看到".chibacity发布了一些答案,其中包含一些非常好的测试,为我做了这个; 同时,我写了一个我自己的考试; 我看到的性能差异实际上是如此巨大,以至于我不得不写一篇关于它的博客文章.

但是,我也应该承认Hans的解释,该ThreadStatic属性确实不是免费的,实际上依赖于CLR辅助方法来实现其魔力.这使得在任何情况下应用是否适当的优化很明显.

对我来说,好消息是,就而言,它似乎已经取得了很大的进步.


我有一个方法(在许多其他事情中)为一些局部变量实例化一些中等大小的数组(~50个元素).

经过一些分析后,我发现这种方法是性能瓶颈.并不是说这种方法需要很长时间才能打电话; 相反,它被简单地调用很多次,非常快(在一个会话中数十万到数百万次,这将是几个小时).因此,即使对其性能进行相对较小的改进也是值得的.

在我看来,也许不是在每次调用时分配一个新数组,我可以使用标记的字段[ThreadStatic]; 每当调用该方法时,它将检查该字段是否在当前线程上初始化,如果没有,则初始化它.从那时起,同一个线程上的所有调用都会有一个阵列都准备就绪.

(该方法初始化数组本身中的每个元素,因此在数组中使用"陈旧"元素应该不是问题.)

我的问题很简单:这看起来是个好主意吗?ThreadStatic以这种方式使用属性是否存在缺陷(即,作为性能优化来降低实例化局部变量的新对象的成本)我应该知道哪些?一个ThreadStatic领域本身的表现可能不是很好; 例如,是否有很多额外的"东西"在后台发生,有自己的成本,使这个功能成为可能?

对我来说,我甚至试图优化像50元素阵列那样便宜(?)的东西是错误的 - 如果是这样的话,绝对让我知道 - 但一般的问题仍然存在.

Han*_*ant 9

[ThreadStatic] 不是免费的午餐.每次访问变量都需要通过CLR中的辅助函数(JIT_GetThreadFieldAddr_Primitive/Objref),而不是由抖动内联编译.它也不是一个真正的替代局部变量,递归就是字节.你真的必须自己剖析这个,用循环中的那么多CLR代码猜测perf是不可行的.


Tim*_*oyd 5

我已经执行了一个简单的基准测试,并且ThreadStatic对问题中描述的简单参数执行得更好.

与许多具有大量迭代的算法一样,我怀疑这是一个直接的GC开销案例,因为它为分配新数组的版本造成了破坏:

更新

测试包括添加的数组迭代以模拟最小数组引用的使用,以及ThreadStatic除先前测试之外的数组引用用法,其中引用被复制到本地:

Iterations : 10,000,000

Local ArrayRef          (- array iteration) : 330.17ms
Local ArrayRef          (- array iteration) : 327.03ms
Local ArrayRef          (- array iteration) : 1382.86ms
Local ArrayRef          (- array iteration) : 1425.45ms
Local ArrayRef          (- array iteration) : 1434.22ms
TS    CopyArrayRefLocal (- array iteration) : 107.64ms
TS    CopyArrayRefLocal (- array iteration) : 92.17ms
TS    CopyArrayRefLocal (- array iteration) : 92.42ms
TS    CopyArrayRefLocal (- array iteration) : 92.07ms
TS    CopyArrayRefLocal (- array iteration) : 92.10ms
Local ArrayRef          (+ array iteration) : 1740.51ms
Local ArrayRef          (+ array iteration) : 1647.26ms
Local ArrayRef          (+ array iteration) : 1639.80ms
Local ArrayRef          (+ array iteration) : 1639.10ms
Local ArrayRef          (+ array iteration) : 1646.56ms
TS    CopyArrayRefLocal (+ array iteration) : 368.03ms
TS    CopyArrayRefLocal (+ array iteration) : 367.19ms
TS    CopyArrayRefLocal (+ array iteration) : 367.22ms
TS    CopyArrayRefLocal (+ array iteration) : 368.20ms
TS    CopyArrayRefLocal (+ array iteration) : 367.37ms
TS    TSArrayRef        (+ array iteration) : 360.45ms
TS    TSArrayRef        (+ array iteration) : 359.97ms
TS    TSArrayRef        (+ array iteration) : 360.48ms
TS    TSArrayRef        (+ array iteration) : 360.03ms
TS    TSArrayRef        (+ array iteration) : 359.99ms
Run Code Online (Sandbox Code Playgroud)

码:

[ThreadStatic]
private static int[] _array;

[Test]
public object measure_thread_static_performance()
{
    const int TestIterations = 5;
    const int Iterations = (10 * 1000 * 1000);
    const int ArraySize = 50;

    Action<string, Action> time = (name, test) =>
    {
        for (int i = 0; i < TestIterations; i++)
        {
            TimeSpan elapsed = TimeTest(test, Iterations);
            Console.WriteLine("{0} : {1:F2}ms", name, elapsed.TotalMilliseconds);
        }
    };

    int[] array = null;
    int j = 0;

    Action test1 = () =>
    {
        array = new int[ArraySize];
    };

    Action test2 = () =>
    {
        array = _array ?? (_array = new int[ArraySize]);
    };

    Action test3 = () =>
    {
        array = new int[ArraySize];

        for (int i = 0; i < ArraySize; i++)
        {
            j = array[i];
        }
    };

    Action test4 = () =>
    {
        array = _array ?? (_array = new int[ArraySize]);

        for (int i = 0; i < ArraySize; i++)
        {
            j = array[i];
        }
    };

    Action test5 = () =>
    {
        array = _array ?? (_array = new int[ArraySize]);

        for (int i = 0; i < ArraySize; i++)
        {
            j = _array[i];
        }
    };

    Console.WriteLine("Iterations : {0:0,0}\r\n", Iterations);
    time("Local ArrayRef          (- array iteration)", test1);
    time("TS    CopyArrayRefLocal (- array iteration)", test2);
    time("Local ArrayRef          (+ array iteration)", test3);
    time("TS    CopyArrayRefLocal (+ array iteration)", test4);
    time("TS    TSArrayRef        (+ array iteration)", test5);

    Console.WriteLine(j);

    return array;
}

[SuppressMessage("Microsoft.Reliability", "CA2001:AvoidCallingProblematicMethods", MessageId = "System.GC.Collect")]
private static TimeSpan TimeTest(Action action, int iterations)
{
    Action gc = () =>
    {
        GC.Collect();
        GC.WaitForFullGCComplete();
    };

    Action empty = () => { };

    Stopwatch stopwatch1 = Stopwatch.StartNew();

    for (int j = 0; j < iterations; j++)
    {
        empty();
    }

    TimeSpan loopElapsed = stopwatch1.Elapsed;

    gc();
    action(); //JIT
    action(); //Optimize

    Stopwatch stopwatch2 = Stopwatch.StartNew();

    for (int j = 0; j < iterations; j++) action();

    gc();

    TimeSpan testElapsed = stopwatch2.Elapsed;

    return (testElapsed - loopElapsed);
}
Run Code Online (Sandbox Code Playgroud)