Ale*_*Exc 8 php svg sanitization
我正在使用d3.js创建图表作为SVG.这些图表是根据经过身份验证的用户的选择动态生成的.生成这些图表后,用户可以选择将生成的SVG下载为PNG或PDF.
目前的工作流程如下:
// JAVASC
// get the element containing generated SVG
var svg = document.getElementById("chart-container");
// Extract the data as SVG text string
var svg_xml = (new XMLSerializer).serializeToString(svg);
// Submit the <FORM> to the server.
var form = document.getElementById("svgform");
form['output_format'].value = output_format; // can be either "pdf" or "png"
form['data'].value = svg_xml ;
form.submit();
Run Code Online (Sandbox Code Playgroud)
FORM元素是一个隐藏的表单,用于POST数据:
<form id="svgform" method="post" action="conversion.php">
<input type="hidden" id="output_format" name="output_format" value="">
<input type="hidden" id="data" name="data" value="">
</form>
Run Code Online (Sandbox Code Playgroud)
PHP文件将提供的SVG数据保存为临时文件:
// check for valid session, etc - omitted for brevity
$xmldat = $_POST['data']; // serialized XML representing the SVG element
if(simplexml_load_string($xmldat)===FALSE) { die; } // reject invalid XML
$fileformat = $_POST['output_format']; // chosen format for output; PNG or PDF
if ($fileformat != "pdf" && $fileformat != "png" ){ die; } // limited options for format
$fileformat = escapeshellarg($fileformat); // escape shell arguments that might have snuck in
// generate temporary file names with tempnam() - omitted for brevity
$handle = fopen($infile, "w");
fwrite($handle, $xmldat);
fclose($handle);
Run Code Online (Sandbox Code Playgroud)
运行转换实用程序,该实用程序读取临时文件($ infile)并在指定的$ fileformat(PDF或PNG)中创建新文件($ outfile).然后,生成的新文件将返回到浏览器,并删除临时文件:
// headers etc generated - omitted for brevity
readfile($outfile);
unlink($infile); // delete temporary infile
unlink($outfile); // delete temporary outfile
Run Code Online (Sandbox Code Playgroud)
我已经研究过使用JavaScript(canvg(),然后是toDataURL,然后是document.write)将SVG转换为PNG,并且可以使用它来生成PNG,但它不允许转换为PDF.
那么:在将它写入文件之前,如何最好地清理或过滤提供给conversion.php的SVG数据?SVG清理的当前状态是什么?PHP中有什么可用的?我应该采用基于白名单的方法来清理提供给conversion.php的SVG数据,还是有更好的方法?
(我不知道XSLT,虽然我可以尝试学习它;我希望尽可能地在PHP中保持清理.使用Windows Server 2008,因此任何使用外部工具的解决方案都需要在该生态系统中可用.)
小智 3
我正在使用 xml 和 PHP,但我完全不确定你的问题。请将其视为一个想法/建议,而不是更多。
SimpleXML 使用 libxml 来加载 xml 内容。 http://www.php.net/manual/en/simplexml.requirements.php
您可以使用以下方法禁用外部实体:
libxml_disable_entity_loader (TRUE)
Run Code Online (Sandbox Code Playgroud)
http://www.php.net/manual/en/function.libxml-disable-entity-loader.php
在使用 simpleXML 加载文件之前。
然后您可以根据 SVG 模式进行验证
https://www.php.net/manual/en/domdocument.schemavalidate.php 或 https://www.php.net/manual/en/domdocument.validate.php
我唯一关心的是 svg 可能包含 script 元素。http://www.w3.org/TR/SVG/script.html#ScriptElement
这里有关于 1.1 DTD 的信息: http://www.w3.org/Graphics/SVG/1.1/DTD/svg-framework.mod http://www.w3.org/TR/2003/REC-SVG11-20030114/ REC-SVG11-20030114.pdf
您可以提供带有脚本元素的修改版本的 SVG DTD,或者循环遍历元素以防止脚本元素出现。
它不会是完美的,但至少比没有好。