C#Regex - 如何解析瑞典字母åäöÅ?的字符串?

Zol*_*mon 1 c# regex html-parsing

我正在尝试以这种格式解析HTML文件中的字符串:

<a href="/userinfo/userinfo.aspx?ID=305157" target="main">MyUsername</a> O22</td>
Run Code Online (Sandbox Code Playgroud)

我想检索"305157","MyUsername"和"O22"中的第一个字母(可以是T,K或O)的信息.

我正在使用这个正则表达式; <a href="/userinfo/userinfo\.aspx\?ID=\d*" target="helgonmain">\w*</a> \w\d\d只要没有任何åäöÅÄÖ的"\ w"所在,它就能正常工作.

我该怎么办?

Joe*_*oey 7

您可以使用特别包含以下内容的字符类:

[\wåäöÅÄÖ]*
Run Code Online (Sandbox Code Playgroud)

或者您可以将Unicode字符类用于字母:

\p{L}
Run Code Online (Sandbox Code Playgroud)

或专门针对拉丁语:

\p{InBasicLatin}
Run Code Online (Sandbox Code Playgroud)