我有一个大型PDF文件,它是建筑物的楼层地图.它有所有办公家具的层,包括座位位置的文本框.
我的目标是用PHP读取这个文件,在文档中搜索文本图层,在文件中获取它们的内容和坐标.这样我可以绘制座位位置 - > x/y坐标.
有没有办法通过PHP做到这一点?(甚至Ruby或Python,如果这是必要的)
Jay*_*Jay 31
查看FPDF(使用FPDI):
http://www.setasign.de/products/pdf-php-solutions/fpdi/
这些将允许您打开PDF并在PHP中添加内容.我猜你也可以使用他们的功能在现有内容中搜索你需要的值.
另一个可能的库是TCPDF:http://www.tecnick.com/public/code/cp_dpage.php? aocp_dp = tcpdf
更新以添加更现代的库:PDF Parser
kas*_*ans 24
有一个php库(pdfparser)可以完全满足您的需求.
项目网站
github上
https://github.com/smalot/pdfparser
演示页/ api
在项目中包含pdfparser后,您可以mypdf.pdf像这样获取所有文本:
<?php
$parser = new \installpath\PdfParser\Parser();
$pdf = $parser->parseFile('mypdf.pdf');
$text = $pdf->getText();
echo $text;//all text from mypdf.pdf
?>
Run Code Online (Sandbox Code Playgroud)
模拟您可以从pdf获取元数据以及获取pdf对象(例如图像).