我对正则表达式(c#)感到绝望,所以我希望得到一些帮助:
基本上我需要解析一个文本,我需要在文本中找到以下信息:
示例文本:
KeywordB:***TextToFind* 其余不相关,但 **KeywordB: Text ToFindB然后是更多文本。
我需要在某个可能以“:”结尾的关键字之后找到单词。
[更新]
谢谢 Andrew 和 Alan:很抱歉重新打开这个问题,但该正则表达式中缺少一件非常重要的事情。正如我在上一条评论中所写的那样,是否可以将变量(要查找多少个单词,取决于关键字)作为正则表达式的一部分?
或者:我可以为每个关键字使用不同的正则表达式(只会满手)。但仍然不知道如何在正则表达式中保持“要查找的词”常量
基本的正则表达式是这样的:
var pattern = @"KeywordB:\s*(\w*)";
\s* = any number of spaces
\w* = 0 or more word characters (non-space, basically)
() = make a group, so you can extract the part that matched
var pattern = @"KeywordB:\s*(\w*)";
var test = @"KeywordB: TextToFind";
var match = Regex.Match(test, pattern);
if (match.Success) {
Console.Write("Value found = {0}", match.Groups[1]);
}
Run Code Online (Sandbox Code Playgroud)
如果您在一行中有多个这些,您可以使用这个:
var test = @"KeywordB: TextToFind KeyWordF: MoreText";
var matches = Regex.Matches(test, @"(?:\s*(?<key>\w*):\s?(?<value>\w*))");
foreach (Match f in matches ) {
Console.WriteLine("Keyword '{0}' = '{1}'", f.Groups["key"], f.Groups["value"]);
}
Run Code Online (Sandbox Code Playgroud)
另外,请在此处查看正则表达式设计器:http : //www.radsoftware.com.au/。它是免费的,我经常使用它。它适用于原型表达式。您需要为基本工作重新安排 UI,但之后就很容易了。
(fyi) 字符串前的“@”意味着\不再意味着特殊的东西,所以你可以输入@"c:\fun.txt"而不是"c:\fun.txt"
让我知道是否应该删除旧帖子,但也许有人想阅读它。
在正则表达式中执行“要查找的单词”的方法如下:
regex = @"(Key1|Key2|Key3|LastName|FirstName|Etc):"
Run Code Online (Sandbox Code Playgroud)
你正在做的事情可能不值得在正则表达式中付出努力,尽管它可能可以按照你想要的方式完成(但仍然不是 100% 清楚需求)。它涉及展望下一场比赛,并在那一点停下来。
这是一个重写为正则表达式+常规功能代码的代码,应该可以解决这个问题。它不关心空格,因此如果您像下面一样请求“Key2”,它会将其与值分开。
string[] keys = {"Key1", "Key2", "Key3"};
string source = "Key1:Value1Key2: ValueAnd A: To Test Key3: Something";
FindKeys(keys, source);
private void FindKeys(IEnumerable<string> keywords, string source) {
var found = new Dictionary<string, string>(10);
var keys = string.Join("|", keywords.ToArray());
var matches = Regex.Matches(source, @"(?<key>" + keys + "):",
RegexOptions.IgnoreCase);
foreach (Match m in matches) {
var key = m.Groups["key"].ToString();
var start = m.Index + m.Length;
var nx = m.NextMatch();
var end = (nx.Success ? nx.Index : source.Length);
found.Add(key, source.Substring(start, end - start));
}
foreach (var n in found) {
Console.WriteLine("Key={0}, Value={1}", n.Key, n.Value);
}
}
Run Code Online (Sandbox Code Playgroud)
其输出是:
Key=Key1, Value=Value1
Key=Key2, Value= ValueAnd A: To Test
Key=Key3, Value= Something
Run Code Online (Sandbox Code Playgroud)