我需要从PDF文档中提取表对象,最好使用Perl以编程方式提取.我可以剪切并粘贴到Excel,但是一旦将数据导入Excel,该表将需要相当多的手动编辑.
我已经做了一些搜索,但到目前为止,似乎大多数论坛都认为大多数API都非常原始.
我编写了一个Perl程序,用于搜索和操作一个文本文件.此CGI进程将文件直接存入内存,根据用户的输入操作文件,然后生成HTML结果.
它功能明智.但是,我知道一旦我在高容量服务器上部署,它将无法在适当的时候做出响应.我怀疑记忆是一个瓶颈.共享该文件的最佳方式是什么,一旦服务器启动它就会被读入内存,而不会再次读取?
我猜的解决方案是一个服务器守护程序,它将文件加载到内存中并为其他进程/线程提供数据.如果是这样,实施IPC的最佳方法是什么?