如何检测我的JSON字符串是否已在Java中转义HTML标记

Sea*_*ull 1 java encoding json

我试图用Java编写单元测试来测试编码的JSON值.我正在尝试执行以下操作:

assertEquals(expectedJSON(),actualJSON())
Run Code Online (Sandbox Code Playgroud)

其中expectedJSON()返回

{
    "someHtml": {
        "html": "<html>HTML&CSS</html>"
    }
}
Run Code Online (Sandbox Code Playgroud)

其中作为actualJSON()返回

 {
        "someHtml": {
            "html": "\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E"
        }
    }
Run Code Online (Sandbox Code Playgroud)

我希望expectedJSON返回realJSON()返回的内容,但我无法找到一种简单的方法来执行此操作.我在网上看过,但在这方面没有找到任何容易的东西.该actualJSON()做一些复杂的处理,需要这种方式返回值.我的expectedJSON()方法看起来像这样

public String expectedJSONWithHTMLValues(){
        return "{" +
                    "\"someHtml\":{" +
                  "\"html\":\"\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E\"}}";
    }
Run Code Online (Sandbox Code Playgroud)

Bri*_*ian 6

要添加到另一个答案,\u转义在Java中有一个有趣的属性,它们实际上由编译器进行预处理(JLS§3.3)).

这样,我的意思是转到编译器之前\u,在源文件中替换字符.因此,您的代码:

public String expectedJSONWithHTMLValues(){
    return "{" +
           "\"someHtml\":{" +
           "\"html\":\"\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E\"}}";
}
Run Code Online (Sandbox Code Playgroud)

正在进行预处理:

public String expectedJSONWithHTMLValues(){
    return "{" +
           "\"someHtml\":{" +
           "\"html\":\"<html>HTML&CSS</html>\"}}";
}
Run Code Online (Sandbox Code Playgroud)

是什么东西被编译.

\u在实际编译文件之前,Java编译器会将任何转义转换为字符.这意味着\u转义可以用在变量名,类名,方法名等中.编译器会将其转换为字符本身并在编译过程中使用它.这就是为什么你应该\n在你的字符串中使用而不是\u000a.如果您使用后者,源代码将来自以下内容:

String s = "My\u000aNewline";
Run Code Online (Sandbox Code Playgroud)

对此:

String s = "My
Newline";
Run Code Online (Sandbox Code Playgroud)

这会导致编译器错误,因为String文字被分割成多行.

这可以让你做一些非常糟糕的事情.例如,这是100%合法的Java代码,可以在任何操作系统上编译:

\u0070\u0075\u0062\u006c\u0069\u0063 \u0063\u006c\u0061\u0073\u0073 \u004d\u0061\u0069\u006e \u007b

    \u0070\u0072\u0069\u0076\u0061\u0074\u0065 \u0073\u0074\u0061\u0074\u0069\u0063 \u0053\u0074\u0072\u0069\u006e\u0067 \u0073\u006f\u006d\u0065\u0053\u0074\u0072\u0069\u006e\u0067 \u003d \u0022\u004d\u0079 \u0053\u0074\u0072\u0069\u006e\u0067\u0022\u003b

    \u0070\u0075\u0062\u006c\u0069\u0063 \u0073\u0074\u0061\u0074\u0069\u0063 \u0076\u006f\u0069\u0064 \u006d\u0061\u0069\u006e\u0028\u0053\u0074\u0072\u0069\u006e\u0067\u005b\u005d \u0061\u0072\u0067\u0073\u0029 \u007b
        \u0053\u0079\u0073\u0074\u0065\u006d\u002e\u006f\u0075\u0074\u002e\u0070\u0072\u0069\u006e\u0074\u006c\u006e\u0028\u0073\u006f\u006d\u0065\u0053\u0074\u0072\u0069\u006e\u0067\u0029\u003b
    \u007d
\u007d
Run Code Online (Sandbox Code Playgroud)

它打印:

My String
Run Code Online (Sandbox Code Playgroud)

不相信我?你自己看.编译器首先将所有\u转义转换为字符,它将所有类似\u0070\u0072\u0069\u0076\u0061\u0074\u0065转换为private\u0073\u0074\u0061\u0074\u0069\u0063\u0053\u0074\u0072\u0069\u006e\u0067转换为String.

无论如何,为了解决你的特定问题,你需要做的就是双重逃避\:

public String expectedJSONWithHTMLValues(){
    return "{" +
           "\"someHtml\":{" +
           "\"html\":\"\\u003Chtml\\u003EHTML\\u0026CSS\\u003C/html\\u003E\"}}";
}
Run Code Online (Sandbox Code Playgroud)

值得注意的是这个字符串:

{"someHtml":{"html":"\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E"}}
Run Code Online (Sandbox Code Playgroud)

不等于此String添加了空格:

{
    "someHtml": {
        "html": "\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E"
    }
}
Run Code Online (Sandbox Code Playgroud)

String.equals 将包含相等的空格,因此请确保您的两个字符串逐字符,包括空格.