我试图从HTML页面中提取一些信息.考虑下面的下拉选择列表:
<select name="ctl00$MainContent$ddlColor" onchange="chageColor(this);setTimeout('__doPostBack(\'ctl00$MainContent$ddlColor\',\'\')', 0)" id="ctl00_MainContent_ddlColor" class="input" style="width:175px;">
<option selected="selected" value="">Color</option>
<option value="00114743-03|large|0|03">CHARCOAL</option>
<option value="00114743-04|large|2|04">BLACK</option>
</select>
Run Code Online (Sandbox Code Playgroud)
它有3个值,"Color","CHARCOAL"和"BLACK".
现在,如果我查看源代码并使用谷歌浏览器复制"CHARCOAL"的XPATH,我会得到
//*[@id="ctl00_MainContent_ddlColor"]/option[2]
Run Code Online (Sandbox Code Playgroud)
但是,我想将信息提取为"CHARCOAL"和"BLACK".我希望将其应用于多个页面,其中下拉列表可能包含更多或更少数量的元素.但是,我总是想跳过第一个元素,它将是"Color".这该怎么做 ?
小智 5
这个给你 ..
//select/option[not(contains(., 'Color'))]/text()
Run Code Online (Sandbox Code Playgroud)
你可以跳过它的第一个选项
//select/option[position() > 1]/text()
Run Code Online (Sandbox Code Playgroud)
我希望这可以有所帮助