我想使用这种方法从现有网页中获取一些文字:
try
{
WebClient client = new WebClient();
result = client.DownloadString(url);
int start = result.IndexOf("startpointstr") ;
end = result.IndexOf("EndpointStr");
result = result.Substring(start, end - start);
string.Format(
MessageBox.Show(result);
}
catch (Exception ex)
{
// handle error
MessageBox.Show(ex.Message);
}
Run Code Online (Sandbox Code Playgroud)
在积极的一面,它适用于英语,但对于像希伯来语这样的语言,它返回无法识别的字符(不是希伯来语)有没有办法重新格式化返回的字符串?
使用WebClient.Encoding属性设置资源的编码.
client.Encoding = System.Text.Encoding.UTF8;
Run Code Online (Sandbox Code Playgroud)