强制"将下一个语句"设置为"if"块时的CLR System.NullReferenceException

Pad*_*ddy 15 .net c# clr lambda c#-4.0

背景

我接受这不是在正常的代码执行期间可能发生的事情,但我在调试时发现它并认为分享有趣.

我认为这是由JIT编译器引起的,但欢迎任何进一步的想法.

我已使用VS2013复制了针对4.5和4.5.1框架的此问题:

VS2013 Premium 12.0.31101.00 Update 4. NET 4.5.50938


建立

要查看此异常,Common Language Runtime Exceptions必须启用: DEBUG>Exceptions...

已启用公共语言运行时例外

我已将问题的原因提炼到以下示例:

using System.Collections.Generic;
using System.Linq;

namespace ConsoleApplication6
{
    public class Program
    {
        static void Main()
        {
            var myEnum = MyEnum.Good;

            var list = new List<MyData>
            {
                new MyData{ Id = 1, Code = "1"},
                new MyData{ Id = 2, Code = "2"},
                new MyData{ Id = 3, Code = "3"}
            };

            // Evaluates to false
            if (myEnum == MyEnum.Bad) // BREAK POINT 
            {
                /*
                 * A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe

                   Additional information: Object reference not set to an instance of an object.
                 */
                var x = new MyClass();

                MyData result;
                //// With this line the 'System.NullReferenceException' gets thrown in the line above:
                result = list.FirstOrDefault(r => r.Code == x.Code);

                //// But with this line, with 'x' not referenced, the code above runs ok:
                //result = list.FirstOrDefault(r => r.Code == "x.Code");
            }
        }
    }

    public enum MyEnum
    {
        Good,
        Bad
    }

    public class MyClass
    {
        public string Code { get; set; }
    }

    public class MyData
    {
        public int Id { get; set; }
        public string Code { get; set; }
    }
}
Run Code Online (Sandbox Code Playgroud)

要复制

在断点上放置if (myEnum == MyEnum.Bad)并运行代码.当达到断点时,Set Next Statement(Ctrl+ Shift+ F10)成为if语句的左括号并运行直到:

抛出NullReferenceException

接下来,注释第一LAMDA声明和评论中的第二个-所以MyClass不使用实例.重新运行进程(按下中断,强制进入if语句并运行).您将看到代码正常工作:

MyClass正确实例化

最后,评论第一LAMDA声明和评论第二个-这样的MyClass情况下使用.然后将if语句的内容重构为一个新方法:

using System.Collections.Generic;
using System.Linq;

namespace ConsoleApplication6
{
    public class Program
    {
        static void Main()
        {
            var myEnum = MyEnum.Good;

            var list = new List<MyData>
            {
                new MyData{ Id = 1, Code = "1"},
                new MyData{ Id = 2, Code = "2"},
                new MyData{ Id = 3, Code = "3"}
            };

            // Evaluates to false
            if (myEnum == MyEnum.Bad) // BREAK POINT 
            {
                MyMethod(list);
            }
        }

        private static void MyMethod(List<MyData> list)
        {
            // When the code is in this method, it works fine
            var x = new MyClass();

            MyData result;

            result = list.FirstOrDefault(r => r.Code == x.Code);
        }
    }

    public enum MyEnum
    {
        Good,
        Bad
    }

    public class MyClass
    {
        public string Code { get; set; }
    }

    public class MyData
    {
        public int Id { get; set; }
        public string Code { get; set; }
    }
}
Run Code Online (Sandbox Code Playgroud)

重新运行测试,一切正常:

MyClass在MyMethod中正确实例化


结论?

我的假设是JIT编译器已将lamda优化为始终为null,并且在初始化实例之前运行了一些进一步优化的代码.

正如我之前提到的,这在生产代码中永远不会发生,但我很想知道发生了什么.

Han*_*ant 10

这是一个非常不可避免的事故,与优化无关.通过使用设置下一语句命令,你绕过更多的代码比你可以很容易地从源代码中看到.只有在查看生成的机器代码时才会变得明显.在断点处使用Debug + Windows + Disassembly.你会看到的:

            // Evaluates to false
            if (myEnum == MyEnum.Bad) // BREAK POINT 
0000016c  cmp         dword ptr [ebp-3Ch],1 
00000170  setne       al 
00000173  movzx       eax,al 
00000176  mov         dword ptr [ebp-5Ch],eax 
00000179  cmp         dword ptr [ebp-5Ch],0 
0000017d  jne         00000209 
00000183  mov         ecx,2B02C6Ch               // <== You are bypassing this
00000188  call        FFD6FAE0 
0000018d  mov         dword ptr [ebp-7Ch],eax 
00000190  mov         ecx,dword ptr [ebp-7Ch] 
00000193  call        FFF0A190 
00000198  mov         eax,dword ptr [ebp-7Ch] 
0000019b  mov         dword ptr [ebp-48h],eax 
            {
0000019e  nop 
                /*
                 * A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe

                   Additional information: Object reference not set to an instance of an object.
                 */
                var x = new MyClass();
0000019f  mov         ecx,2B02D04h             // And skipped to this
000001a4  call        FFD6FAE0 
// etc...
Run Code Online (Sandbox Code Playgroud)

那么,那个神秘的代码是什么?这不是您在程序中明确写出的任何内容.您可以使用"反汇编"窗口中的"设置下一个语句"命令查找.将其移动到地址00000183,即if()语句之后的第一个可执行代码.开始步进,你会看到它执行一个名为的类的构造函数ConsoleApplication1.Program.<>c__DisplayClass5

除了现有的SO问题,这是一个自动生成的源代码中的lambda表达式类.需要list在程序中存储捕获的变量.由于你跳过它的创建,list在lambda中取消引用总是会用NRE轰炸.

作为"漏洞抽象"的标准案例,C#有一些但不是非常蛮横的.当然,你无能为力,你当然可以责怪调试人员没有正确猜测这一点,但这是一个非常难以解决的问题.它不容易找出该代码是属于if()语句还是后面的代码.设计问题,调试信息是基于行号,没有代码行.另外一般来说x64抖动问题,即使在简单的情况下它也会出现问题.哪个应该在VS2015中修复.

这是你必须学习Hard Way™的东西.如果确实非常重要,那么我向您展示了如何正确设置下一个语句,您必须在反汇编视图中执行此操作才能使其正常工作.请随时在connect.microsoft.com报告此问题,但如果他们还不知道它,我会感到惊讶.