相关疑难解决方法(0)

将字符串的字符编码从windows-1252转换为utf-8

我已经将Word文档(docx)转换为html,转换后的html将windows-1252作为其字符编码.在.Net中,对于这个1252字符编码,所有特殊字符都显示为" ".这个html正在Rad编辑器中显示,如果html是Utf-8格式,它将正确显示.

我曾尝试过以下代码但没有静脉

Encoding wind1252 = Encoding.GetEncoding(1252);  
Encoding utf8 = Encoding.UTF8;  
byte[] wind1252Bytes = wind1252.GetBytes(strHtml);  
byte[] utf8Bytes = Encoding.Convert(wind1252, utf8, wind1252Bytes);  
char[] utf8Chars = new char[utf8.GetCharCount(utf8Bytes, 0, utf8Bytes.Length)];   
utf8.GetChars(utf8Bytes, 0, utf8Bytes.Length, utf8Chars, 0);  
string utf8String = new string(utf8Chars);
Run Code Online (Sandbox Code Playgroud)

有关如何将html转换为UTF-8的任何建议?

c# asp.net

14
推荐指数
2
解决办法
7万
查看次数

标签 统计

asp.net ×1

c# ×1