可能重复:
使用C#正则表达式删除HTML标记
我必须删除标记并将所有其他信息保存在XML文件中.在使用正则表达式时,我有点不知所措.我只能逐行读取文件然后尝试"找到"所有标签并用""替换它们 - 空字符串.但是,它没有按预期工作:
line = Regex.Replace(line, "<.*>", "");
Run Code Online (Sandbox Code Playgroud)
我可以请一个解释为什么这不能按预期工作(我认为它应该只是找到<>内部符号的所有可能组合.另外,你能不能推荐正则表达式的一个很好的介绍.我经常看了很多-expressions.info但我发现它不完整和令人困惑.
我必须处理一些包含西里尔文本的文件,我在Visual Studio 2012 Ultimate中使用StreamReader/ StreamWriter.
然而,有一些荒谬的问题(或我的误解).以下构造函数工作得很好:
using (StreamReader reader = new StreamReader(someFile, Encoding.Default)){
}
Run Code Online (Sandbox Code Playgroud)
然而,当我尝试以下内容时:
using (StreamWriter writer = new StreamWriter(someOtherfile, Encoding.Default)){
}
Run Code Online (Sandbox Code Playgroud)
我得到一个ivalid构造函数的编译时错误.然而,以下是MSDN的规范:
public StreamWriter(Stream stream, Encoding encoding);
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?