Selenium - 如何获取元素及其子元素文本

Len*_*ymm 9 java xpath webdriver selenium-webdriver

简短版本:我可以获取聊天消息(在java中使用selenium的By.xpath),但我希望将微笑包含在适当的位置.

更长的版本:您好,我一直在处理这个有趣的问题,我需要从Web浏览器解析聊天消息并使用java和selenium重新创建它.我没有解析消息文本的问题,但我想用它的子元素(微笑图标)解析它.除了手动源代码解析之外,有没有什么好的方法呢?

这是我能够访问的单个消息的代码:

<div class="chat_msg chat_msg_caller ">
    <div class="chat_msg_head">
        <span class="chat_msg_author">
            SomeAuthor
        </span>
        <span class="chat_msg_date">
           SomeDate
        </span>
    </div>
    <div class="chat_msg_body message_text">
        SomeMessageText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
        SomeOtherText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
    </div>
</div>
Run Code Online (Sandbox Code Playgroud)

这是我如何获取聊天消息文本的示例:

String msgTxt = we.findElement(By.xpath("//div[@id='messages_body']/div[" + (i + 1) + "]/div[@class='chat_msg_body message_text']")).getText();

我的结果:SomeMessageText SomeOtherText 我想要的结果:SomeMessageText:D SomeOtherText:D

CSS文件:

http://badoocdn.com/v2/-/-/css/base-ltr.268.css
http://badoocdn.com/v2/-/-/css/page.chat-ltr.22.css
http://badoocdn.com/v2/-/-/css/popup.messenger-ltr.230.css
Run Code Online (Sandbox Code Playgroud)

结构体:

<div id="messages_body">
   <div id="pager" class="pages"> … </div>
   <div class="chat_msg chat_msg_caller ">
       <div class="chat_msg_head">
          <span class="chat_msg_author"> … </span>
          <span class="chat_msg_date"> … </span>
       </div>
       <div class="chat_msg_body message_text"> … </div>
   </div>
   <div class="me chat_msg chat_msg_owner "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="me chat_msg chat_msg_owner "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   ...
Run Code Online (Sandbox Code Playgroud)

Ard*_*sco 12

如果我正确理解你,你只需要在父元素上执行getText(),例如

driver.findElement(By.cssSelector(".chat_msg_body message_text")).getText()
Run Code Online (Sandbox Code Playgroud)

这应该回来了

SomeMessageText:D SomeOtherText:D

它可能会删除一些空格,你需要先去看看.

编辑

看到你正在处理潜在的CSS问题,你可以尝试以下方法:

driver.findElement(By.cssSelector(".chat_msg_body message_text")).getAttribute("textContent")
Run Code Online (Sandbox Code Playgroud)

即使CSS正在移动所有地方,这应该得到textContent.