T. *_*ira 4 c# string replace diacritics non-ascii-characters
我正在使用Visual Studio和C#编写一个非常简单的Windows应用程序来编辑电影的字幕文件.我想要一个程序,在没有对话句时为对话句添加空格.例如:
-嘿,怎么了?
-没什么.
至
- 嘿,怎么了?
- 没什么.
我使用工具箱创建一个界面,只有一个按钮,用于选择正确的文件.这是我对此按钮的代码:
private void button1_Click(object sender, EventArgs e)
{
if (openFileDialog1.ShowDialog() == DialogResult.OK)
{
string text = File.ReadAllText(openFileDialog1.FileName, Encoding.GetEncoding("iso-8859-1"));
text = text.Replace("-A", "- A");
File.WriteAllText(openFileDialog1.FileName, text, Encoding.GetEncoding("iso-8859-1"));
}
}
Run Code Online (Sandbox Code Playgroud)
这样做基本上用" - A"代替"-A",从而创造一个空间.这是我提出的解决方案,我打算用每个字母做这个,包括重音字母,如À,Á,È,É等等.
这不起作用.如果我把text = text.Replace(" - É"," - É"); 该计划什么都不做.
我想知道的是我该如何解决这个问题.
感谢您的阅读,如果您有更好的替代方案,请随时告诉我.
至于评论,请使用Regex.
var rx = new System.Text.RegularExpressions.Regex("^-([^ ])");
... in your loop
var text = rx.Replace(text, "- $1");
Run Code Online (Sandbox Code Playgroud)
基本上它的作用是它在字符串的开头搜索一个破折号,但只有一个空格后面没有.()表示短划线后面的字符应该"保存".替换搜索提供的字符串,并用短划线,空格和之前匹配的相同字符替换(doh!)匹配的文本.不管是什么.
资料来源:https://xkcd.com/208/
编辑:你没有循环,你有一个字符串包含文件的完整内容,其中每一行应包含一个字幕行(右?).如果是这种情况,您可以配置正则表达式将字符串视为行列表,如下所示:
var rx = new Regex("^-([^ ])", RegexOptions.Multiline);
Run Code Online (Sandbox Code Playgroud)
请看这个小提琴的例子:https: //dotnetfiddle.net/ciFlAu