eve*_*ve 3 javascript dom textnode
我正在使用JavaScript来从DOM对象中提取所有文本.我的算法遍历DOM对象本身,它是后代,如果节点是TEXT_NODE类型而不是累积它的nodeValue.
出于一些奇怪的原因,我也得到了类似的东西:
#hdr-editions a { text-decoration:none; }
#cnn_hdr-editionS { text-align:left;clear:both; }
#cnn_hdr-editionS a { text-decoration:none;font-size:10px;top:7px;line-height:12px;font-weight:bold; }
#hdr-prompt-text b { display:inline-block;margin:0 0 0 20px; }
#hdr-editions li { padding:0 10px; }
Run Code Online (Sandbox Code Playgroud)
我该如何过滤?我需要使用其他东西吗?我只想要文字.
从事物的外观来看,你也是从<style>元素中收集文本.您可能想要检查这些:
var ignore = { "STYLE":0, "SCRIPT":0, "NOSCRIPT":0, "IFRAME":0, "OBJECT":0 }
if (element.tagName in ignore)
continue;
Run Code Online (Sandbox Code Playgroud)
您可以将任何其他元素添加到对象图中以忽略它们.
| 归档时间: |
|
| 查看次数: |
1733 次 |
| 最近记录: |