简短版本:我可以获取聊天消息(在java中使用selenium的By.xpath),但我希望将微笑包含在适当的位置.
更长的版本:您好,我一直在处理这个有趣的问题,我需要从Web浏览器解析聊天消息并使用java和selenium重新创建它.我没有解析消息文本的问题,但我想用它的子元素(微笑图标)解析它.除了手动源代码解析之外,有没有什么好的方法呢?
这是我能够访问的单个消息的代码:
<div class="chat_msg chat_msg_caller ">
<div class="chat_msg_head">
<span class="chat_msg_author">
SomeAuthor
</span>
<span class="chat_msg_date">
SomeDate
</span>
</div>
<div class="chat_msg_body message_text">
SomeMessageText
<span class="sml-icon biggrin">
<span>
:D
</span>
</span>
SomeOtherText
<span class="sml-icon biggrin">
<span>
:D
</span>
</span>
</div>
</div>
Run Code Online (Sandbox Code Playgroud)
这是我如何获取聊天消息文本的示例:
String msgTxt = we.findElement(By.xpath("//div[@id='messages_body']/div[" + (i + 1) + "]/div[@class='chat_msg_body message_text']")).getText();
我的结果:SomeMessageText SomeOtherText 我想要的结果:SomeMessageText:D SomeOtherText:D
CSS文件:
http://badoocdn.com/v2/-/-/css/base-ltr.268.css
http://badoocdn.com/v2/-/-/css/page.chat-ltr.22.css
http://badoocdn.com/v2/-/-/css/popup.messenger-ltr.230.css
Run Code Online (Sandbox Code Playgroud)
结构体:
<div id="messages_body">
<div id="pager" class="pages"> … </div>
<div class="chat_msg chat_msg_caller ">
<div class="chat_msg_head">
<span class="chat_msg_author"> … </span>
<span …Run Code Online (Sandbox Code Playgroud) 我遇到了编码问题.不确定它是否与IDE有关,但我使用的是NetBeans 7.4.我在J2EE项目中得到了这段代码:
String test = "kuku?i?né";
System.out.println(new String(test.getBytes("UTF-8"))); // should display ok
System.out.println(new String(test.getBytes("ISO-8859-1")));
System.out.println(new String(test.getBytes("UTF-16")));
System.out.println(new String(test.getBytes("US-ASCII")));
System.out.println(new String(test.getBytes("windows-1250")));
System.out.println(test); // should display ok
Run Code Online (Sandbox Code Playgroud)
当我运行它时,它永远不会正常显示.UTF-8应该可以打印出来,但不是.当我尝试时:
System.out.println(Charset.defaultCharset());
Run Code Online (Sandbox Code Playgroud)
它返回了windows-1252.该项目设置为UTF-8编码.我甚至尝试在UTF-8中重新保存这个特定的java文件,但它仍然无法正常显示.
另一方面,我试图创建J2SE项目,当我运行相同的代码时,它正确显示.默认字符集也返回UTF-8.
两个项目都设置了UTF-8编码.
我希望我的J2EE项目像J2SE一样运行.直到我将我的java更新到版本1.7.0_51-b13之前我才注意到这个问题但是我不确定这是否相关.
我遇到了像这个家伙一样的问题:http://forums.netbeans.org/ptopic37752.html
我也尝试过为整个IDE设置默认编码:-J-Dfile.encoding = UTF-8但它没有帮助.
我注意到一个重要的事实.当我创建一个新的Web应用程序时,它显示正常.当我创建新的Maven Web应用程序时,它显示不正确.
在这里发现了同样的问题:https://netbeans.org/bugzilla/show_bug.cgi?id = 224456
我还没有修好它.仍然没有解决方案.
在我的pom.xml中,编码设置正确,但最后仍显示windows-1252.
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
Run Code Online (Sandbox Code Playgroud)