如何在Java中获取unicode字符的十进制值?

Mik*_*ler 7 java unicode

我需要一种编程方式来获取String中每个字符的十进制值,以便我可以将它们编码为HTML实体,例如:

UTF-8:

???
Run Code Online (Sandbox Code Playgroud)

十进制:

著者名
Run Code Online (Sandbox Code Playgroud)

Jon*_*eet 14

我怀疑你是从一个转换只是感兴趣charint,这是隐式的:

for (int i = 0; i < text.length(); i++)
{
    char c = text.charAt(i);
    int value = c;
    System.out.println(value);
}
Run Code Online (Sandbox Code Playgroud)

编辑:如果你想处理代理对,你可以使用类似的东西:

for (int i = 0; i < text.length(); i++)
{
    int codePoint = text.codePointAt(i);
    // Skip over the second char in a surrogate pair
    if (codePoint > 0xffff)
    {
        i++;
    }
    System.out.println(codePoint);
}
Run Code Online (Sandbox Code Playgroud)