如何通过编程方式通过XML :: Twig添加实体声明?

Sir*_*ert 4 xml perl xml-twig xml-entities

对于我的生活,我无法理解实体处理的XML :: Twig文档.

我有一些用HTML :: Tidy生成的XML.电话如下:

my $tidy = HTML::Tidy->new({
    'indent'          => 1,
    'break-before-br' => 1,
    'output-xhtml'    => 0,
    'output-xml'      => 1,
    'char-encoding'   => 'raw',
});

$str = "foo   bar";
$xml = $tidy->clean("<xml>$str</xml>");
Run Code Online (Sandbox Code Playgroud)

产生:

<html>
  <head>
    <meta content="tidyp for Linux (v1.02), see www.w3.org" name="generator" />
    <title></title>
  </head>
  <body>foo &nbsp; bar</body>
</html>
Run Code Online (Sandbox Code Playgroud)

XML :: Twig(可以理解)barf &nbsp;.我想做一些转换,通过XML :: Twig运行它:

my $twig = XML::Twig->new(
  twig_handlers => {... handlers ...}
);

$twig->parse($xml);
Run Code Online (Sandbox Code Playgroud)

$twig->parse行barfs的&nbsp;,但我无法弄清楚如何添加&nbsp;元素编程.我尝试过这样的事情:

my $entity = XML::Twig::Entity->new("nbsp", "&#160;");
$twig->entity_list->add($entity);
$twig->parse($xml);
Run Code Online (Sandbox Code Playgroud)

......但没有快乐.

请帮忙=)

mir*_*rod 5

在这样的情况下,一个肮脏但有效的技巧将是添加假的DTD声明.

然后执行解析的XML :: Parser将假定实体是在DTD中定义的,并且不会对其进行barf.

要删除伪造的DTD声明,您可以输出树枝的根.如果您需要不同的声明,请创建它并替换当前声明:

#!/usr/bin/perl 

use strict;
use warnings;

use XML::Twig;

my $fake_dtd= '<!DOCTYPE head SYSTEM "foo"[]>'; # foo may not even exist

my $xml='<html>
  <head>
    <meta content="tidyp for Linux (v1.02), see www.w3.org" name="generator" />
    <title></title>
  </head>
  <body>foo &nbsp; bar</body>
</html>';

XML::Twig->new->parse( $fake_dtd . $xml)->root->print;
Run Code Online (Sandbox Code Playgroud)