如何删除不可打印的字符

fon*_*ini 0 string unicode utf-8 go

我正在尝试从Golang中的字符串中删除不可打印的字符。

https://play.golang.org/p/Touihf5-hGH

invisibleChars := "Douglas?"
fmt.Println(invisibleChars)
fmt.Println(len(invisibleChars))

normal := "Douglas"
fmt.Println(normal)
fmt.Println(len(normal))
Run Code Online (Sandbox Code Playgroud)

输出:

Douglas?
10
Douglas
7
Run Code Online (Sandbox Code Playgroud)

第一个字符串的末尾有一个不可见的字符。

我尝试替换非ASCII字符,但它也删除了重音符号。

如何仅删除不可打印的字符?

小智 9

invisibleChars = strings.TrimFunc(invisibleChars, func(r rune) bool {
        return !unicode.IsGraphic(r)
    })
Run Code Online (Sandbox Code Playgroud)

去游乐场:https : //play.golang.org/p/39yWgnnRPXr


icz*_*cza 6

您可以将符文删除unicode.IsGraphic()unicode.IsPrint()报告为假。要从rune字符串中删除某些,可以使用strings.Map()

例如:

invisibleChars := "Douglas?"
fmt.Printf("%q\n", invisibleChars)
fmt.Println(len(invisibleChars))

clean := strings.Map(func(r rune) rune {
    if unicode.IsGraphic(r) {
        return r
    }
    return -1
}, invisibleChars)

fmt.Printf("%q\n", clean)
fmt.Println(len(clean))

clean = strings.Map(func(r rune) rune {
    if unicode.IsPrint(r) {
        return r
    }
    return -1
}, invisibleChars)

fmt.Printf("%q\n", clean)
fmt.Println(len(clean))
Run Code Online (Sandbox Code Playgroud)

输出(在Go Playground上尝试):

"Douglas\u200b"
10
"Douglas"
7
"Douglas"
7
Run Code Online (Sandbox Code Playgroud)