如何更改XML以使用空元素标签?

use*_*486 5 xml tags perl xml-twig

我是XML :: Twig的新手.如何更改所有空元素以使用空元素标记(<foo/>)而不是开始标记和结束标记组合(<foo></foo>)?

输入:

<book>
    <given-names>Maurice<xref ref-type="fn" rid="fnI_1"></xref></given-names>
    <colspec colname="col1" colnum="1"></colspec>
    <entry align="left"><p></p></entry>
</book>
Run Code Online (Sandbox Code Playgroud)

我需要输出为:

<book>
    <given-names>Maurice<xref ref-type="fn" rid="fnI_1"/></given-names>
    <colspec colname="col1" colnum="1"/>
    <entry align="left"><p/></entry>
</book>
Run Code Online (Sandbox Code Playgroud)

我试过了:

       use XML::Twig;
       my $xml = XML::Twig->new(twig_handlers => {
                                  'xref' => sub {$_->set_tag('#EMPTY'),},
                                },
                                pretty_print => 'indented',                                        
                               );
       $xml->parse('sample.xml');
       $xml->print;
}
Run Code Online (Sandbox Code Playgroud)

但我无法处理它.如何在没有内容标签的情况下全面改变空标签?我该怎么改变?

ike*_*ami 5

XML :: LibXML将自动输出较短的版本.

use XML::LibXML qw( );
print XML::LibXML->new()->parse_file($ARGV[0])->toString();
Run Code Online (Sandbox Code Playgroud)

对于XML :: Twig,默认情况下它也使用较短的形式(empty_tags => 'normal').但是,它只考虑从中创建的空元素<foo/>.(对我来说似乎很蠢!)我做了一些挖掘,发现如果它认为元素是空的,它确实允许你改变.这是使用set_empty和完成的set_not_empty.

use XML::Twig qw( );
my $twig = XML::Twig->new(
   twig_handlers => {
      '*' => sub {
         $_->set_empty() if !$_->first_child();
      },
   },
);
$twig->parsefile($ARGV[0]);
$twig->print();
Run Code Online (Sandbox Code Playgroud)


小智 2

如果你想坚持使用 Twig,你可以这样做:

#!usr/bin/perl
use strict;
use warnings;
use XML::Twig;

my $xml = XML::Twig->new(twig_handlers => {
             'p' => sub { 
                 if (!$_->first_child()) { $_->set_content('#EMPTY') } 
              },
           },
           pretty_print => 'indented',
           empty_tags => 'normal'                                 
);

$xml->parsefile('file.xml');
$xml->print;
Run Code Online (Sandbox Code Playgroud)

基本上,您必须手动检查元素是否不包含任何内容,然后将其设置为空元素。