精简版
我正在检索一个数据库值,其中包含一个简短但完整的HTML结构.我想剥离所有的HTML标签,最后得到一个值.围绕我的相关信息的HTML总是一样的,我只需要弄清楚字符串包含什么类型的换行符,制表符或空格,这样我就可以匹配并删除它.
有没有我可以在线粘贴String的地方,或者我可以检查String的实际内容的其他方式,以便我能够将其删除?
长版,以及我已经尝试过的内容:
从HP Quality Center数据库检索String,并在自动化测试执行的控制台中打印,该字符串被解释为显示为两个空格.粘贴到word,eclipse或QC脚本编辑器时,它显示为换行符.
我试图用\n空白和空格替换空格¶.什么都行不通.
我从一个正在运行的VBScript中翻译了这个脚本.有问题的不可见字符被定义为vbcrlf和VBCRLF那里.由于某种原因,他们在相关参数值之前的替换字符串中使用小写,在相关子字符串之后的字符串中使用大写.它们被定义为变量,并不在String本身内:<html>"&vbcrlf&"<body>"&vbcrlf&"<div...
这个网站建议我应该使用\n https://answers.yahoo.com/question/index?qid=20070506205148AAmr92N,因为他们写道:
vbCrLf ="\n"#Carriage returnlinefeed组合
我对这里使用上/下案例的不一致感到有些困惑但是......
编辑:
在谷歌搜索回车换行组合后,我了解到它可以在/r/n这里定义:回车顺序和新换行.
但是我花了很长时间才发现它,它没有回答我的问题,我怎么能更好地确定字符串包含哪种不可见的字符.我会把问题打开.
Tor*_*xed 10
要查看字符串的内容(包括它的"隐藏"值),您始终可以执行以下操作:
print( [data] )
# or
print( repr(data) )
Run Code Online (Sandbox Code Playgroud)
如果您在评论中描述的系统中,您也可以这样做:
with open('/var/log/debug.log', 'w') as fh:
fh.write( str( [data] ) )
Run Code Online (Sandbox Code Playgroud)
然而,这只会让您大致了解数据的外观,但如果这样可以解决您的问题或问题,那就太棒了.如果您需要进一步的帮助,请编辑您的问题或提交新问题:)