使用Java Script从URL解析XML/RSS

Aru*_*amy 19 javascript xml-parsing

您好我想 使用纯Java脚本(而不是jquery)从http://rss.news.yahoo.com/rss/entertainment等实时网址解析xml/rss .我google了很多.没有什么对我有用.任何人都可以帮助处理一段代码.

Poi*_*ars 39

(您不能搜索很多内容.)一旦您解决了同源策略,并且资源是使用XML MIME类型(在本例中为text/xml),您可以执行以下操作:

var x = new XMLHttpRequest();
x.open("GET", "http://feed.example/", true);
x.onreadystatechange = function () {
  if (x.readyState == 4 && x.status == 200)
  {
    var doc = x.responseXML;
    // …
  }
};
x.send(null);
Run Code Online (Sandbox Code Playgroud)

(另请参阅AJAX,以及其他事件处理程序属性的XMLHttpRequest Level 2规范[Working Draft].)

实质上:不需要解析. 如果您想访问XML数据,请使用标准DOM Level 2+ CoreDOM Level 3 XPath方法,例如

/* DOM Level 2 Core */
var title = doc.getElementsByTagName("channel")[0].getElementsByTagName("title")[0].firstChild.nodeValue;

/* DOM Level 3 Core */
var title = doc.getElementsByTagName("channel")[0].getElementsByTagName("title")[0].textContent;

/* DOM Level 3 XPath (not using namespaces) */
var title = doc.evaluate('//channel/title/text()', doc, null, 0, null).iterateNext();

/* DOM Level 3 XPath (using namespaces) */
var namespaceResolver = (function () {
  var prefixMap = {
    media: "http://search.yahoo.com/mrss/",
    ynews: "http://news.yahoo.com/rss/"
  };

  return function (prefix) {
    return prefixMap[prefix] || null;
  };
}());

var url = doc.evaluate('//media:content/@url', doc, namespaceResolver, 0, null).iterateNext();
Run Code Online (Sandbox Code Playgroud)

(另请参阅JSX:xpath.js以获取不使用jQuery的方便的,名称空间感知的DOM 3 XPath包装器.)

但是,如果由于某些(错误的)原因,MIME类型不是XML MIME类型,或者DOM实现无法识别它,则可以使用最近浏览器中内置的解析器之一来解析responseText属性值.请参阅pradeek的答案,了解适用于IE/MSXML的解决方案.以下应该适用于其他地方:

var parser = new DOMParser();
var doc = parser.parseFromString(x.responseText, "text/xml");
Run Code Online (Sandbox Code Playgroud)

按上述步骤进行.

在运行时使用功能测试来确定给定实现的正确代码分支.最简单的方法是:

if (typeof DOMParser != "undefined")
{
  var parser = new DOMParser();
  // …
}
else if (typeof ActiveXObject != "undefined")
{
  var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");
  // …
}
Run Code Online (Sandbox Code Playgroud)

又见DOMParserHTML5:DOM解析和序列化(工作草案).


Geu*_*uis 11

您可能遇到的一个大问题是,通常情况下,您无法获取跨域数据.这是大多数rss feed的大问题.

处理在javascript跨域中加载数据的常用方法是调用JSONP.基本上,这意味着您要检索的数据包含在javascript回调函数中.您使用脚本标记加载URL,然后在代码中定义该函数.因此,当脚本加载时,它会执行该函数并将数据作为参数传递给它.

大多数xml/rss提要的问题是仅提供xml的服务往往不提供JSONP包装功能.

在进一步研究之前,请检查您的数据源是否提供json格式和JSONP功能.这将使这更容易.

现在,如果您的数据源提供json和jsonp功能,则必须具有创造性.

处理此问题的相对简单方法是使用代理服务器.您的代理服务器在您控制的某个地方运行,并充当中间人以获取您的数据.服务器加载你的xml,然后你的javascript代替它做请求.如果代理服务器运行在相同的域名上,那么您可以使用标准的xhr(ajax)请求,而不必担心跨域的问题.

或者,您的代理服务器可以将数据包装在jsonp回调中,您可以使用上面提到的方法.

如果您使用的是jQuery,那么xhr和jsonp请求是内置方法,因此编写代码非常容易.其他常见的js库也应该支持这些.如果你从头开始编写所有这些,那么它的工作要多一些,但并不是非常困难.

现在,一旦你得到你的数据,希望它只是json.然后就不需要解析了.

但是,如果你最终不得不坚持使用xml/rss版本,并且如果你是jQuery,你可以简单地使用jQuery.parseXML http://api.jquery.com/jQuery.parseXML/.