Dra*_*SAN 22 xml node.js xml-parsing
我试图使用node.js模块xml2js
我的代码很简单:
function testparse(pathname, callback) {
var parser = require('xml2js').Parser(),
util = require('util'),
fs = require('fs'),
fs.readFile(pathname, function (err, data) {
parser.parseString(data, function(err, result) {
console.log('Complete result:');
console.log(util.inspect(result, {depth: null})); //Work
console.log('Try to access element:');
console.log(result.smil.body); //Work
console.log(result.smil.body.update); //Undefined
});
});
}
Run Code Online (Sandbox Code Playgroud)
我的xml文件如下:
<?xml version="1.0"?>
<smil>
<head/>
<body>
<update /*some field*//>
<stream name="name"/>
<playlist /*some field*/>
<video /*some field*//>
<video /*some field*//>
<video /*some field*//>
</playlist>
</body>
</smil>
Run Code Online (Sandbox Code Playgroud)
输出给了我:
Complete result:
{ smil:
{ head: [''],
body:
[ { update: [[Object]],
stream: [[Object]],
playlist: [[Object]] } ] } }
Try to access element:
[Object]
Undefined
Run Code Online (Sandbox Code Playgroud)
我通过尝试成功访问了body,但现在我卡住了,是否有一个模板或示例xml2js如何在某处输出解析的xml?
Gar*_*idd 51
xml2js有一个令人羡慕的任务:以可以反转的方式将XML转换为JSON,而不事先知道架构.起初看起来很明显:
<name>Fred</name> ? { name: "Fred" }
<chacha /> ? { chacha: null }
Run Code Online (Sandbox Code Playgroud)
容易到目前为止,对吗?不过呢?
<x><y>z</y><x>
Run Code Online (Sandbox Code Playgroud)
删除人性化的名字会带来不确定性xml2js.起初,您可能认为这是非常合理的:
{ x: { y: "z" } }
Run Code Online (Sandbox Code Playgroud)
稍后,您将浏览此XML文本并实现您猜测的架构错误:
<x><y>z</y><y>z2</y></x>
Run Code Online (Sandbox Code Playgroud)
哦,哦.也许我们应该使用一个数组.至少所有成员都有相同的标记:
{ x: [ "z", "z2" ] }
Run Code Online (Sandbox Code Playgroud)
然而,不可避免的是,事实证明这是短视的:
<x><y>z</y><y>z2</y><m>n</m>happy</x>
Run Code Online (Sandbox Code Playgroud)
呃...
{ x: [ { y: "z" }, { y : "z2" }, { m: "n" }, "happy" ] }
Run Code Online (Sandbox Code Playgroud)
...然后有人用一些属性和XML命名空间来推销你.
构建更简洁的输出模式的方法对您来说显而易见.您可以从标记和属性名称中推断出详细信息.你了解它.
图书馆不同意这种理解.
如果库不知道模式,它必须"使用和滥用"数组,额外的对象层,特殊属性名称或全部三个.
唯一的选择是采用可变输出模式.正如我们上面所看到的那样,一开始就让它变得简单,但你很快就会发现自己编写了大量的条件代码.考虑如果具有相同标记名称的子项折叠到列表中会发生什么,但仅当有多个子列表时:
if (Array.isArray(x.y)) {
processTheYChildren(x.y);
} else if (typeof(x.y) === 'object') {
// only one child; construct an array on the fly because my converter didn't
processTheYChildren([x.y]);
} else ...
Run Code Online (Sandbox Code Playgroud)
TL; DR:它看起来比它看起来更难.阅读Open311 JSON和XML Conversion页面,了解其他JSON端表示的详细信息.所有"使用和滥用"数组,额外的对象层,名称未出现在原始XML中的成员,或全部三个.
Cli*_*ood 44
正如xml2js的文档所述,您可以通过将属性设置explicitArray为false(重要:它必须是一个布尔值,因为字符串"false"将无效!),可以将解析器配置为不滥用数组.
例:
var parser = new xml2js.Parser({explicitArray : false});
Run Code Online (Sandbox Code Playgroud)
这样,您应该能够以更简单的方式访问JSON属性.我希望这可以帮助任何人.
回来的JSON不是JavaScript友好的.我编写了一个辅助函数,可以使它更容易使用.
请务必在使用之前阅读它,以便了解它的作用.
xml.parseString(xmlString, function(err, results){
if(err) throw err
results = cleanXML(results);
});
var cleanXML = function(xml){
var keys = Object.keys(xml),
o = 0, k = keys.length,
node, value, singulars,
l = -1, i = -1, s = -1, e = -1,
isInt = /^-?\s*\d+$/,
isDig = /^(-?\s*\d*\.?\d*)$/,
radix = 10;
for(; o < k; ++o){
node = keys[o];
if(xml[node] instanceof Array && xml[node].length === 1){
xml[node] = xml[node][0];
}
if(xml[node] instanceof Object){
value = Object.keys(xml[node]);
if(value.length === 1){
l = node.length;
singulars = [
node.substring(0, l - 1),
node.substring(0, l - 3) + 'y'
];
i = singulars.indexOf(value[0]);
if(i !== -1){
xml[node] = xml[node][singulars[i]];
}
}
}
if(typeof(xml[node]) === 'object'){
xml[node] = cleanXML(xml[node]);
}
if(typeof(xml[node]) === 'string'){
value = xml[node].trim();
if(value.match(isDig)){
if(value.match(isInt)){
if(Math.abs(parseInt(value, radix)) <= Number.MAX_SAFE_INTEGER){
xml[node] = parseInt(value, radix);
}
}else{
l = value.length;
if(l <= 15){
xml[node] = parseFloat(value);
}else{
for(i = 0, s = -1, e = -1; i < l && e - s <= 15; ++i){
if(value.charAt(i) > 0){
if(s === -1){
s = i;
}else{
e = i;
}
}
}
if(e - s <= 15){
xml[node] = parseFloat(value);
}
}
}
}
}
}
return xml;
};
Run Code Online (Sandbox Code Playgroud)
例子:
{
queries: { query: [ {}, {}, {} ] }
}
Run Code Online (Sandbox Code Playgroud)
变
{
queries: [ {}, {}, {} ]
}
Run Code Online (Sandbox Code Playgroud)
和
{
types: { type: [ {}, {}, {} ] }
}
Run Code Online (Sandbox Code Playgroud)
变
{
types: [ {}, {}, {} ]
}
Run Code Online (Sandbox Code Playgroud)
它还将安全地转换整数/浮点数.
编辑:替换为... in with for
对于那些想知道 xml2js 使用和滥用数组的人
对于我的文件,树将是:
.result //Object
|_.head //Array
|_.body //Array
|_.update //Array
| |_.$ //Object
| |_.fields //Strings
|
|_.stream //Array
| |_.$ //Object
| |_.fields //Strings
|
|_.playlist //Array
|_.$ //Object
|_.fields //Strings
|
|_.video //Array
|_.$ //Object
|_.fields //Strings
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
35276 次 |
| 最近记录: |