使用python正则表达式从字符串中提取单词

Dip*_*ole 0 python regex

我想从字符串中提取型号,

/dev/sda:

ATA device, with non-removable media
    Model Number:       ST500DM002-1BD142                       
    Serial Number:      W2AQHKME
    Firmware Revision:  KC45    
    Transport:          Serial, SATA Rev 3.0
Run Code Online (Sandbox Code Playgroud)

我写的正则表达式

re.search("Model Number:(\s+[\w+^\w|d]\n\t*)", str)
Run Code Online (Sandbox Code Playgroud)

但问题是,它与字符串str中的任何特殊字符(非ascii)都不匹配

Python 2.6

注意:字符串可以是任何字符/数字的组合(包括特殊字符)

Avi*_*Raj 6

您的正则表达式将是

Model Number:\s*([\w-]+)
Run Code Online (Sandbox Code Playgroud)

Python代码应该是

>>> import re
>>> s = """
... 
... /dev/sda:
... 
... ATA device, with non-removable media
...     Model Number:       ST500DM002-1BD142                       
...     Serial Number:      W2AQHKME
...     Firmware Revision:  KC45    
...     Transport:          Serial, SATA Rev 3.0"""
>>> m = re.search(r'Model Number:\s*([^\n]+)', s)
>>> m.group(1)
'ST500DM002-1BD142'
Run Code Online (Sandbox Code Playgroud)

说明:

  • Model Number:\s*匹配Model Number:后跟零个或多个空格的字符串。
  • ([^\n]+) 捕获一次或多次而不捕获换行符的任何字符。