DGT*_*DGT 0 html python text-processing
有没有什么方法可以<option>s将以下HTML表单中的所有内容选择<select>到python列表中,如此,['a','b','c','d']?
<select name="sel">
<option value="a">a</option>
<option value="b">b</option>
<option value="c">c</option>
<option value="d">d</option>
</select>
Run Code Online (Sandbox Code Playgroud)
提前谢谢了.
import re
text = '''<select name="sel">
<option value="a">a</option>
<option value="b">b</option>
<option value="c">c</option>
<option value="d">d</option>
</select>'''
pattern = re.compile(r'<option value="(?P<val>.*?)">(?P=val)</option>')
handy_list = pattern.findall(text)
print handy_list
Run Code Online (Sandbox Code Playgroud)
将输出
['a', 'b', 'c', 'd']
Run Code Online (Sandbox Code Playgroud)
免责声明:使用正则表达式解析HTML在一般情况下不起作用.