使用Java和RegEx转换字符串中的大小写

And*_*eas 35 java regex string lowercase uppercase

问题:转

"My Testtext TARGETSTRING My Testtext" 
Run Code Online (Sandbox Code Playgroud)

"My Testtext targetstring My Testtext"
Run Code Online (Sandbox Code Playgroud)

Perl支持可以在替换字符串中使用的"\ L"操作.

Pattern-Class不支持此操作:

此类不支持的Perl构造:[...]预处理操作\ l\u,\ L和\ U. https://docs.oracle.com/javase/10/docs/api/java/util/regex/Pattern.html

pol*_*nts 56

你不能在Java正则表达式中这样做.您必须使用String.toUpperCase()toLowerCase()不是手动进行后处理.

这是一个如何使用正则表达式来查找和大写句子中长度至少为3的单词的示例

    String text = "no way oh my god it cannot be";
    Matcher m = Pattern.compile("\\b\\w{3,}\\b").matcher(text);

    StringBuilder sb = new StringBuilder();
    int last = 0;
    while (m.find()) {
        sb.append(text.substring(last, m.start()));
        sb.append(m.group(0).toUpperCase());
        last = m.end();
    }
    sb.append(text.substring(last));

    System.out.println(sb.toString());
    // prints "no WAY oh my GOD it CANNOT be"
Run Code Online (Sandbox Code Playgroud)

注意appendReplacementappendTail

请注意,上面的解决方案使用substring和管理tail索引等.事实上,如果你使用Matcher.appendReplacement和,你可以没有这些appendTail.

    StringBuffer sb = new StringBuffer();
    while (m.find()) {
        m.appendReplacement(sb, m.group().toUpperCase());
    }
    m.appendTail(sb);
Run Code Online (Sandbox Code Playgroud)

注意sb现在如何StringBuffer而不是StringBuilder.直到Matcher提供StringBuilder重载,StringBuffer如果你想使用这些方法,你就会陷入更慢的困境.

这取决于能否提高效率以获得更高的可读性是否值得.

也可以看看


Von*_*onC 8

您可以使用正则表达式捕获组(如果您确实需要使用正则表达式,也就是说,意味着" TARGETSTRING"足够复杂并且"常规"足以证明正则表达式可以检测到正则表达式).
然后,您将申请toLowerCase()到组#1.

import java.util.regex.*;

public class TargetToLowerCase {

  public static void main(String[] args) {
    StringBuilder sb= new StringBuilder(
            "my testtext TARGETSTRING my testtext");
    System.out.println(sb);
    String regex= "TARGETSTRING ";
    Pattern p = Pattern.compile(regex); // Create the pattern.
    Matcher matcher = p.matcher(sb); // Create the matcher.
    while (matcher.find()) {
      String buf= sb.substring(matcher.start(), matcher.end()).toLowerCase();
      sb.replace(matcher.start(), matcher.end(), buf);
    }
    System.out.println(sb);
  }
}
Run Code Online (Sandbox Code Playgroud)

  • 这应该是伪代码吗?"$ 1".toLowerCase()`显然是先评估,所以replaceAll只看到"$ 1",这意味着它什么都不做. (3认同)

And*_*sun 5

要在正则表达式级别上执行此操作,必须使用\U大写模式并将\E其关闭。这是一个如何在IntelliJ IDEA find-and-replace对话框中使用此功能的示例,该对话框将一组类字段转换为JUnit断言(在IDE工具提示处是find-and-replace转换的结果):

在此处输入图片说明

  • 虽然这是 IntelliJ 特定的,但普通的 Java 正则表达式不支持这一点。 (2认同)

YCF*_*F_L 5

Java9 +

从Java 9+开始,你可以使用String :: replaceAll,你可以使用Function<MatchResult, String>例如我们使用polygenelubricants的例子:

String text = "this is just a test which upper all short words";
String regex = "\\b\\w{0,3}\\b";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(text);
String result = matcher.replaceAll(matche -> matche.group().toUpperCase());

System.out.println(result);
Run Code Online (Sandbox Code Playgroud)

要不就 :

String result = Pattern.compile(regex)
        .matcher(text)
        .replaceAll(matche -> matche.group().toUpperCase());
Run Code Online (Sandbox Code Playgroud)

产量

this IS just A test which upper ALL short words
     ^^      ^                  ^^^
Run Code Online (Sandbox Code Playgroud)