使用 Python Selenium 从元素的 <br> 中获取文本

Question

使用 Python Selenium 从元素的 <br> 中获取文本

ls1*_*101 1 html python selenium xpath line-breaks

我正在从网站提取联系信息（文本），目前我可以使用以下xpath语法提取所有类数据：

//*[@id="nomapdata"]/div/div/div/div[2]/div[1]

Run Code Online (Sandbox Code Playgroud)

将此xpath用于元素，我得到以下文本结果：

Name
Title
Company Website
Phone Number

Run Code Online (Sandbox Code Playgroud)

我想要做的是单独拉出这些元素中的每一个，但问题是，数据由分隔<br> </br>，并且我没有成功隔离每个元素。

下面是一个 HTML 结构的例子：

<div class="col-sm-d">
"
                  Name"
<br>
"
                              Title"
<br>
a href="www.website.com" target="_blank">http://www.website.com</a>
<br>
"

Phone: (555) 555-5555"
<br>

Run Code Online (Sandbox Code Playgroud)

我能够隔离的唯一元素是网站。

我如何隔离这种情况下的每个数据？

Answer 1

And*_*son 6

尝试获取文本节点列表为

driver.find_element_by_xpath('//*[@id="nomapdata"]/div/div/div/div[2]/div[1]').text.split("\n")

Run Code Online (Sandbox Code Playgroud)

如果电话号码后面有更多您不想使用的文本节点：

driver.find_element_by_xpath('//*[@id="nomapdata"]/div/div/div/div[2]/div[1]').text.split("\n")[:4]

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，11 月前
查看次数：	3199 次
最近记录：	6 年，3 月前

使用 Python Selenium 从元素的 &lt;br&gt; 中获取文本

使用 Python Selenium 从元素的 <br> 中获取文本