Yui*_*nko 1 html python selenium
我想在tr标签中找到第二个td元素,它有 4 个td标签。这是我想从那里获取的HTML代码。
<tr>
<td width="10%" class="cell">&nsp;</td>
<td class="cell" width="40%">Sports</td>
<td class="cell rgt" width="40%">-29.94</td>
<td width="10%" class="cell">&nsp;</td>
</tr>
<tr>
<td class="cell">&nsp;</td>
<td class="cell">Casino</td>
<td class="cell rgt">464.22</td>
<td class="cell">&nsp;</td>
</tr>
<tr>
<td class="cell">&nsp;</td>
<td class="cell">Poker</td>
<td class="cell rgt">14.29</td>
<td class="cell">&nsp;</td>
</tr>
<tr>
<td class="cell">&nsp;</td>
<td class="cell">Games / Bingo</td>
<td class="cell rgt">145.17</td>
<td class="cell">&nsp;</td>
</tr>
<tr>
<td class="cell">&nsp;</td>
<td class="cell b">Total</td>
<td class="cell b rgt">593.75</td>
<td class="cell b">&nsp;</td>
</tr>
<tr class="c3">
<td class="cell">&nsp;</td>
<td class="cell b">Withdrawals to date</td>
<td class="cell b rgt">0.00</td>
<td class="cell">&nsp;</td>
</tr>
<tr class="c3">
<td class="cell">&nsp;</td>
<td class="cell b">Balance</td>
<td class="cell b rgt">593.75</td>
<td class="cell">&nsp;</td>
</tr>
Run Code Online (Sandbox Code Playgroud)
我想获取类似的数据
Sports, -29.94
Casino, 434.22
Poker, 14.29
Games / Bingo, 145.17
Total, 593.75
Withdrawals to date, 0.00
Balance, 593.75
Run Code Online (Sandbox Code Playgroud)
这是我为了获取数据而编写的代码片段。
bet365 = webdriver.Chrome()
bet365.get("https://www.abcde.com")
...
for incomes in bet365.find_elements_by_class_name("rgt"):
if incomes.text != "Close Window":
print(incomes.text)
Earning = incomes.find_element_by_xpath('..').find_element_by_xpath("//td[2]")
print(Earning.text)
Run Code Online (Sandbox Code Playgroud)
正如你所看到的,我可以从HTML代码中获取所有数字,例如
-29.94
464.22
14.29
145.17
593.75
0.00
593.75
Run Code Online (Sandbox Code Playgroud)
但我无法获取体育、赌场等内容。
我怎样才能自动获取它们。
小智 7
你犯了一个小错误。
代替
Earning = incomes.find_element_by_xpath('..').find_element_by_xpath("//td[2]")
Run Code Online (Sandbox Code Playgroud)
和
Earning = incomes.find_element_by_xpath('..').find_element_by_xpath(".//td[2]")
Run Code Online (Sandbox Code Playgroud)
应该有一个“。” 位于“td”前面,以便驱动程序不会在整个 HTML 页面中搜索该元素。应从当前元素开始搜索该元素。
归档时间: |
|
查看次数: |
5607 次 |
最近记录: |