如何从 C# 中的越南语字符串中删除 Unicode 符号

1 c# unicode

我正在为我在越南的合作伙伴做一个项目,我必须解决越南语。如何删除越南语字符串中的所有 Unicode 符号?

例如:Xin chào các b?n!(大家好) --> Xin chao cac ban!

Ton*_*Bui 5

您可以定义一个string[] VietnameseSigns包含所有越南语的符号。

例如:

private static readonly string[] VietnameseSigns = new string[]
        {

            "aAeEoOuUiIdDyY",

            "áà??ãâ???????????",

            "ÁÀ??ÃÂ???????????",

            "éè???ê?????",

            "ÉÈ???Ê?????",

            "óò??õô???????????",

            "ÓÒ??ÕÔ???????????",

            "úù?????????",

            "ÚÙ?????????",

            "íì???",

            "ÍÌ???",

            "?",

            "?",

            "ý????",

            "Ý????"
        };
Run Code Online (Sandbox Code Playgroud)

之后,您定义一个函数来从输入字符串中删除所有越南语符号。

例如:

public static string RemoveSign4VietnameseString(string str)
        {
            for (int i = 1; i < VietnameseSigns.Length; i++)
            {
                for (int j = 0; j < VietnameseSigns[i].Length; j++)
                    str = str.Replace(VietnameseSigns[i][j], VietnameseSigns[0][i - 1]);
            }
            return str;
        }
Run Code Online (Sandbox Code Playgroud)