如何从短划线以外的字符串中删除所有非字母数字字符?

Luk*_*101 571 c# regex

如何从字符串和空格字符以外的字符串中删除所有非字母数字字符?

Ama*_*osh 823

替换[^a-zA-Z0-9 -]为空字符串.

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");
Run Code Online (Sandbox Code Playgroud)

  • 值得一提的是`-`必须位于字符类的末尾,或者使用反斜杠进行转义,以防止用于范围. (73认同)
  • 这是一个正则表达式编译版本:`return Regex.Replace(str,"[^ a-zA-Z0-9 _.] +","",RegexOptions.Compiled);`[相同的基本问题](http:// stackoverflow. COM /问题/ 1120198 /最有效的路去除的,特殊字符,从字符串/ 1120248#1120248) (19认同)
  • @BrianScott我知道这是旧的,但在搜索中被发现,所以我觉得这是相关的.这实际上取决于您运行的.NET版本.> 2.0使用``"`&`string.Empty`完全相同.http://stackoverflow.com/questions/151472/what-is-the-difference-between-string-empty-and-empty-string (17认同)
  • @MGOwen因为每次使用""都会因为字符串不可变而创建一个新对象.当您使用string.empty时,您将重用表示空字符串所需的单个实例,该字符串更快且效率更高. (13认同)
  • @Dan在你的正则表达式中设置全局标志 - 没有它,它只是替换第一个匹配.快速谷歌应该告诉你如何在经典ASP正则表达式中设置全局标志.否则,查找`replaceAll`函数而不是`replace`. (6认同)
  • \w 应该用于字母数字字符。az 不会匹配变音符号,而 \w 会。 (2认同)
  • 正则表达式解决方案比下面显示的代码解决方案慢. (2认同)

ata*_*ata 341

我可以使用RegEx,它们可以提供优雅的解决方案,但它们可能会导致性能问题.这是一个解决方案

char[] arr = str.ToCharArray();

arr = Array.FindAll<char>(arr, (c => (char.IsLetterOrDigit(c) 
                                  || char.IsWhiteSpace(c) 
                                  || c == '-')));
str = new string(arr);
Run Code Online (Sandbox Code Playgroud)

使用紧凑框架(没有FindAll)时

将FindAll替换为1

char[] arr = str.Where(c => (char.IsLetterOrDigit(c) || 
                             char.IsWhiteSpace(c) || 
                             c == '-')).ToArray(); 

str = new string(arr);
Run Code Online (Sandbox Code Playgroud)

1 Shawn的评论Featherly

  • 在我的测试中,这种技术要快得多.确切地说,它比正则表达式替换技术快3倍. (39认同)
  • 这也处理unicode字符,而不仅仅是US ASCII. (29认同)
  • 紧凑框架没有FindAll,你可以用`char [] arr = str.Where替换FindAll(c =>(char.IsLetterOrDigit(c)|| char.IsWhiteSpace(c)|| c ==' - ' ))ToArray的();` (11认同)
  • 有人测试过吗?那根本没有用。-但这对我来说确实如此:string str2 = new string(str.Where(c =&gt;(char.IsLetterOrDigit(c)))。ToArray()); (2认同)

jos*_*989 43

你可以试试:

   string s1= Regex.Replace(s,"[^A-Za-z0-9 _]","");
Run Code Online (Sandbox Code Playgroud)

s你的字符串在哪里

  • @DavidBandel 这是 C# (2认同)

Zai*_*Ali 37

使用System.Linq

string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());
Run Code Online (Sandbox Code Playgroud)


Tru*_*oft 20

正则表达式是[^\w\s\-]*:

\s最好使用而不是space(),因为文本中可能有一个选项卡.

  • 该解决方案远远优于上述解决方案,因为它还支持国际(非英语)字符.<! - 语言:c# - > string s ="MötleyCrue日本人:の氏名和汉字爱和平假名あい"; string r = Regex.Replace(s,"[^ \\ w \\ s - ]*",""); 以上产生r:MötleyCrue日本人の氏名和Kanji爱和平假名あい (4认同)
  • 除非你想删除选项卡。 (2认同)
  • 使用@在字符串中转义\转换:@"[^\w\s-]*" (2认同)

Ppp*_*Ppp 13

根据这个问题的答案,我创建了一个静态类并添加了这些.认为它可能对某些人有用.

public static class RegexConvert
{
    public static string ToAlphaNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z0-9]");
        return rgx.Replace(input, "");
    }

    public static string ToAlphaOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z]");
        return rgx.Replace(input, "");
    }

    public static string ToNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^0-9]");
        return rgx.Replace(input, "");
    }
}
Run Code Online (Sandbox Code Playgroud)

然后这些方法可以用作:

string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();
Run Code Online (Sandbox Code Playgroud)

  • 对于您提供的示例,如果提供每种方法的结果,也会很有用。 (2认同)

小智 5

要快点吗?

public static class StringExtensions 
{
    public static string ToAlphaNumeric(this string self, params char[] allowedCharacters)
    {
        return new string(Array.FindAll(self.ToCharArray(), c => char.IsLetterOrDigit(c) || allowedCharacters.Contains(c)));
    }
}
Run Code Online (Sandbox Code Playgroud)

这将允许您指定要允许的字符。


Bja*_*eCK 5

这是一个非正则表达式堆分配友好的快速解决方案,这正是我正在寻找的。

不安全版。

public static unsafe void ToAlphaNumeric(ref string input)
{
    fixed (char* p = input)
    {
        int offset = 0;
        for (int i = 0; i < input.Length; i++)
        {
            if (char.IsLetterOrDigit(p[i]))
            {
                p[offset] = input[i];
                offset++;
            }
        }
        ((int*)p)[-1] = offset; // Changes the length of the string
        p[offset] = '\0';
    }
}
Run Code Online (Sandbox Code Playgroud)

对于那些不想使用不安全或不信任字符串长度黑客的人。

public static string ToAlphaNumeric(string input)
{
    int j = 0;
    char[] newCharArr = new char[input.Length];

    for (int i = 0; i < input.Length; i++)
    {
        if (char.IsLetterOrDigit(input[i]))
        {
            newCharArr[j] = input[i];
            j++;
        }
    }

    Array.Resize(ref newCharArr, j);

    return new string(newCharArr);
}
Run Code Online (Sandbox Code Playgroud)