extract-document-data作为json输出中的xml字符串元素

Lon*_*ane 3 xml json marklogic

我试图用" 匹配 "文档中的一些元素来丰富我的搜索结果,使用查询选项" extract-document-data "之类的

<options xmlns="http://marklogic.com/appservices/search">
<extract-document-data selected="include">
      <extract-path>/language-version/language-version-canonical-model/title</extract-path>
      <extract-path>/language-version/language-version-canonical-model/language</extract-path>
</extract-document-data>
(...)
</options>  
Run Code Online (Sandbox Code Playgroud)

当我运行搜索并且我要求Json输出(使用标题Accept :)时application/json,我得到了json和" strinxml "的混合结果:

{  
  "snippet-format": "snippet",  
  "total": 564,  
  "start": 1,  
  "page-length": 10,  
  "selected": "include",  
  "results": [  
    {  
      "index": 1,  
      "uri": "ENV/CHEM/NANO(2015)22/ANN5/2",  
      "path": "fn:doc(\"ENV/CHEM/NANO(2015)22/ANN5/2\")",  
      (...)  
      "matches": [  
        {  
          "path": "fn:doc(\"ENV/CHEM/NANO(2015)22/ANN5/2\")/ns2:language-version/ns2:language-version-raw-data/*:document/*:page[22]",  
          (...)  
        }  
      ],  
      "extracted": {  
        "kind": "element",  
        "content": [  
          "&lt;language&gt;En&lt;/language&gt;",  
          "&lt;title&gt;ZINC OXIDE DOSSIERANNEX 5&lt;/title&gt;",  
          "&lt;reference&gt;ENV/CHEM/NANO(2015)22/ANN5&lt;/reference&gt;",  
          "&lt;classification&gt;2&lt;/classification&gt;",  
          "&lt;modificationDate&gt;2015-04-16T00:00:00.000+02:00&lt;/modificationDate&gt;",  
          "&lt;subject label_en=\"media\" &gt;media&lt;/subject&gt;",  
          "&lt;subject label_en=\"fish\" "&gt;fish&lt;/subject&gt;",  
        ]  
      }  
    },  
Run Code Online (Sandbox Code Playgroud)

这里的问题是" 提取 "部分,正如你所看到的,看起来像xml元素被简单地复制为字符串,当我真的希望它们被转换为json时.

有人对这个问题有所了解吗?

grt*_*tjn 6

MarkLogic不会转换内容.因此,当要求JSON格式的搜索响应时,XML将保持XML.由于您无法在JSON中真正嵌入XML,因此它会被序列化为字符串.

您可以尝试在搜索结果上应用REST转换,并使用类似json:transform-to-json(可能使用自定义配置)的内容来动态转换.例如,像这样的服务器端JavaScript转换:

/* jshint node:true,esnext:true */
/* global xdmp */

var json = require('/MarkLogic/json/json.xqy');
var config = json.config('custom');

function toJson(context, params, content) {
  'use strict';

  var response = content.toObject();

  if (response.results) {
    response.results.map(function(result) {
      if (result.extracted && result.extracted.content) {
        result.extracted.content.map(function(content, index) {
          if (content.match(/^</) && !content.match(/^<!/)) {
            result.extracted.content[index] = json.transformToJson(xdmp.unquote(content), config);
          }
        });
      }
    });
  }

  return response;
}

exports.transform = toJson;
Run Code Online (Sandbox Code Playgroud)

当然,您也可以转换客户端.

HTH!