我有以下字符串:\n[Example] \xc3\xb6\xc3\xa4\xc3\xbc\xc3\x9f asdf 1234 (1a\xc3\xb6) (not necessary),
解释:
\n[Example] 可选,不需要
\xc3\xb6\xc3\xa4\xc3\xbc\xc3\x9f asdf 1234我需要的最重要的部分。每个字符、数字、特殊字符以及德语字符都\xc3\xa4\xc3\x84\xc3\xb6\xc3\x96\xc3\xbc\xc3\x9c\xc3\x9f可以在这里找到。
\n贪婪选择可能是防止像德国字符这样的字符的最佳解决方案,对吗?
(1a\xc3\xb6)可选和必需的
(not necessary)可选,不需要。如果出现的话可能是(not ...)或者(unusual)
,逗号也可以是可选的。但也不需要。
我使用以下正则表达式:/(?:\\[.*\\]\\s)?(?<name>.*?)(?:\\s\\([not|unusual].*?\\))?\\,/g
问题:
\n当我在逗号处使用可选参数时,?它将整个字符串拆分为单独的字符。
当我将组中的非贪婪选择更改name为贪婪选择时,可选逗号被分隔。但现在从 开始的示例字符串\xc3\xb6被选择到最后。
第一个标准括号内的字符串()可以以大写或小写开头。目前我只能识别大写字母。
这是我对 regex101 的尝试,其中包含一堆示例: https: //regex101.com/r/Lx2anw/1
\n很抱歉问了一个非常具体的问题,但我已经以我的知识结束了......
\n有人对我在这里可以做什么有什么建议吗?
\n