我得到了一些带有不同公司广告的数据集。
例如
<jobs>
<job>
<company>A</company>
<value>Testvalue</value>
</job>
<job>
<company>A</company>
<value>Testvalue</value>
</job>
<job>
<company>B</company>
<value>Testvalue</value>
</job>
<job>
<company>C</company>
<value>Testvalue</value>
</job>
</jobs>
Run Code Online (Sandbox Code Playgroud)
我想做的是生成自定义输出。我希望每个公司只有1条记录
想要的示例输出:
<jobs>
<job>
<company>A</company>
<value>Testvalue</value>
</job>
<job>
<company>B</company>
<value>Testvalue</value>
</job>
<job>
<company>C</company>
<value>Testvalue</value>
</job>
</jobs>
Run Code Online (Sandbox Code Playgroud)
我尝试的是以下内容:
如果公司不在数组中,则将其附加到数组中并将项目附加到另一个数组中。
(: loop through job in jobs :)
for $ad in //jobs/job
(: firmenarray, "unique" ads :)
let $companys := ()
let $ads := ()
(: declare company of ad:)
let $company := $ad//company[1]
(: if ad/company not within companyarray > add & concat to ads :)
let $test := if(not(fn:index-of($companys, $company))) then(
(: add ad/company to companys :)
$companys = fn:insert-before($companys, 0, $company),
(: add jobs/job to ads :)
$ads = fn:insert-before($ads, 0, $ad)
)
return $ads
Run Code Online (Sandbox Code Playgroud)
不知何故,它不起作用,我有点想找出原因...
group byMartin Honnen 的解决方案是显而易见的最佳方案。但是,如果您想迭代地在XQuery中填充序列或数组,那么必须了解您的方法不能在像XQuery这样的功能语言中工作,因为所有变量都是不可变的,这一点很重要。如果您想超越简单的XPath和FLWOR表达式,那么了解函数式编程的基础非常重要。
功能语言中迭代的“等效”是递归,因此这是使用用户定义函数的任务递归解决方案:
declare function local:unique($companies, $unique) {
if(empty($companies)) then $unique
else if($companies[1]/company = $unique/company)
then local:unique(tail($companies), $unique)
else local:unique(tail($companies), ($unique, $companies[1]))
};
<jobs>{
local:unique(/jobs/job, ())
}</jobs>
Run Code Online (Sandbox Code Playgroud)
这种遍历序列和汇总结果的特定模式非常普遍,以至于甚至被抽象为它自己的标准函数fn:fold-left($sequence, $start-value, $aggregation-function)。有了它的帮助,解决方案变得很短:
<jobs>{
fn:fold-left(/jobs/job, (), function($companies, $company) {
if($company/company = $companies/company) then $companies
else ($companies, $company)
})
}</jobs>
Run Code Online (Sandbox Code Playgroud)
但是,由于您将每个新条目与以前找到的所有唯一公司条目进行比较,因此此输出效率仍然很低。实施得当的group by人可能总是会击败它。
| 归档时间: |
|
| 查看次数: |
131 次 |
| 最近记录: |