ls1*_*101 1 html python selenium xpath line-breaks
我正在从网站提取联系信息(文本),目前我可以使用以下xpath语法提取所有类数据:
//*[@id="nomapdata"]/div/div/div/div[2]/div[1]
Run Code Online (Sandbox Code Playgroud)
将此xpath用于元素,我得到以下文本结果:
Name
Title
Company Website
Phone Number
Run Code Online (Sandbox Code Playgroud)
我想要做的是单独拉出这些元素中的每一个,但问题是,数据由 分隔<br> </br>,并且我没有成功隔离每个元素。
下面是一个 HTML 结构的例子:
<div class="col-sm-d">
"
Name"
<br>
"
Title"
<br>
a href="www.website.com" target="_blank">http://www.website.com</a>
<br>
"
Phone: (555) 555-5555"
<br>
Run Code Online (Sandbox Code Playgroud)
我能够隔离的唯一元素是网站。
我如何隔离这种情况下的每个数据?
尝试获取文本节点列表为
driver.find_element_by_xpath('//*[@id="nomapdata"]/div/div/div/div[2]/div[1]').text.split("\n")
Run Code Online (Sandbox Code Playgroud)
如果电话号码后面有更多您不想使用的文本节点:
driver.find_element_by_xpath('//*[@id="nomapdata"]/div/div/div/div[2]/div[1]').text.split("\n")[:4]
Run Code Online (Sandbox Code Playgroud)