如何在C#中知道字符串编码

Gaa*_*ara 2 character-encoding c#-4.0

我从第三方程序中获取了一个我无法控制的字符串.我的代码片段以HTML格式输出.这在英语中很好用,但在其他语言中它会以有趣的方式显示.例如,西班牙语的口音看起来很有趣,东方语言(即韩语)中的人物看起来很有趣.我很确定我需要做一些编码工作,以便所有语言都能正确显示.

我对编码的理解有点差,所以在发布真正的问题之前,我直观地认为:"如何在C#中将其编码为UTF-8",我希望通过更简单的方式对此事进行更多的了解.的问题.

我的问题是:我如何知道输入字符串的编码类型?在西班牙语中,当我得到一个口音时,它看起来像这样:"Acción",而不是"Acción".这是ANSI还是我在处理什么?

非常感谢提前!

Han*_*ant 7

我有口音:"Acción"

Ã字符的存在是一个死的赠品.重音资本字符的字符代码为0xC0及以上.这通常是双字节utf-8编码字符中的第一个字节.ó字形是代码点U + 00F3,utf-8编码为0xC3 + 0xB3.哪个是Ã和³的代码点

字符串以utf-8编码,但您正在使用像Encoding.Default这样的8位编码来读取它