小编Len*_*ymm的帖子

Selenium - 如何获取元素及其子元素文本

简短版本:我可以获取聊天消息(在java中使用selenium的By.xpath),但我希望将微笑包含在适当的位置.

更长的版本:您好,我一直在处理这个有趣的问题,我需要从Web浏览器解析聊天消息并使用java和selenium重新创建它.我没有解析消息文本的问题,但我想用它的子元素(微笑图标)解析它.除了手动源代码解析之外,有没有什么好的方法呢?

这是我能够访问的单个消息的代码:

<div class="chat_msg chat_msg_caller ">
    <div class="chat_msg_head">
        <span class="chat_msg_author">
            SomeAuthor
        </span>
        <span class="chat_msg_date">
           SomeDate
        </span>
    </div>
    <div class="chat_msg_body message_text">
        SomeMessageText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
        SomeOtherText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
    </div>
</div>
Run Code Online (Sandbox Code Playgroud)

这是我如何获取聊天消息文本的示例:

String msgTxt = we.findElement(By.xpath("//div[@id='messages_body']/div[" + (i + 1) + "]/div[@class='chat_msg_body message_text']")).getText();

我的结果:SomeMessageText SomeOtherText 我想要的结果:SomeMessageText:D SomeOtherText:D

CSS文件:

http://badoocdn.com/v2/-/-/css/base-ltr.268.css
http://badoocdn.com/v2/-/-/css/page.chat-ltr.22.css
http://badoocdn.com/v2/-/-/css/popup.messenger-ltr.230.css
Run Code Online (Sandbox Code Playgroud)

结构体:

<div id="messages_body">
   <div id="pager" class="pages"> … </div>
   <div class="chat_msg chat_msg_caller ">
       <div class="chat_msg_head">
          <span class="chat_msg_author"> … </span>
          <span …
Run Code Online (Sandbox Code Playgroud)

java xpath webdriver selenium-webdriver

9
推荐指数
1
解决办法
3万
查看次数

将项目编码设置为UTF-8,默认字符集返回windows-1252

我遇到了编码问题.不确定它是否与IDE有关,但我使用的是NetBeans 7.4.我在J2EE项目中得到了这段代码:

    String test = "kuku?i?né";
    System.out.println(new String(test.getBytes("UTF-8"))); // should display ok
    System.out.println(new String(test.getBytes("ISO-8859-1")));
    System.out.println(new String(test.getBytes("UTF-16")));
    System.out.println(new String(test.getBytes("US-ASCII")));
    System.out.println(new String(test.getBytes("windows-1250")));
    System.out.println(test); // should display ok
Run Code Online (Sandbox Code Playgroud)

当我运行它时,它永远不会正常显示.UTF-8应该可以打印出来,但不是.当我尝试时:

    System.out.println(Charset.defaultCharset());
Run Code Online (Sandbox Code Playgroud)

它返回了windows-1252.该项目设置为UTF-8编码.我甚至尝试在UTF-8中重新保存这个特定的java文件,但它仍然无法正常显示.

另一方面,我试图创建J2SE项目,当我运行相同的代码时,它正确显示.默认字符集也返回UTF-8.

两个项目都设置了UTF-8编码.

我希望我的J2EE项目像J2SE一样运行.直到我将我的java更新到版本1.7.0_51-b13之前我才注意到这个问题但是我不确定这是否相关.

我遇到了像这个家伙一样的问题:http://forums.netbeans.org/ptopic37752.html

我也尝试过为整个IDE设置默认编码:-J-Dfile.encoding = UTF-8但它没有帮助.

我注意到一个重要的事实.当我创建一个新的Web应用程序时,它显示正常.当我创建新的Maven Web应用程序时,它显示不正确.

在这里发现了同样的问题:https://netbeans.org/bugzilla/show_bug.cgi?id = 224456

我还没有修好它.仍然没有解决方案.

在我的pom.xml中,编码设置正确,但最后仍显示windows-1252.

<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
Run Code Online (Sandbox Code Playgroud)

java netbeans utf-8 character-encoding maven

6
推荐指数
1
解决办法
4573
查看次数