我有一个 pdf 文件,我想替换 pdf 文件中的一些文本并生成新的 pdf。我怎么能在python中做到这一点?我试过 reportlab ,reportlab 没有任何功能来搜索文本和替换它。我可以使用什么其他模块?
(我在 Ubuntu 上)我正在尝试运行 PortAudio 示例,但遇到很多错误(如下所述)。我已经把头文件portaudio.h 放在了程序的目录下。我不知道。我认为这是链接器错误。请帮忙!
/tmp/cc5EbTlT.o: 在函数main':
paex_record.c:(.text+0x37e): undefined reference to
Pa_Initialize' paex_record.c:(.text+0x397): 未定义引用Pa_GetDefaultInputDevice'
paex_record.c:(.text+0x3de): undefined reference to
Pa_GetDeviceInfo' paex_record.c:(.text+0x436): 未定义引用Pa_OpenStream'
paex_record.c:(.text+0x45a): undefined reference to
Pa_StartStream' paex_record.c:(.text +0x493): 未定义引用Pa_Sleep'
paex_record.c:(.text+0x4c2): undefined reference to
Pa_IsStreamActive' paex_record.c:(.text+0x4eb): 未定义引用Pa_CloseStream'
paex_record.c:(.text+0x5fa): undefined reference to
Pa_GetDefaultOutputDevice' paex_record.c:(.text+0x641): 未定义引用Pa_GetDeviceInfo'
paex_record.c:(.text+0x6b2): undefined reference to
Pa_OpenStream' paex_record.c:(.text+0x6e3) ): 未定义引用Pa_StartStream'
paex_record.c:(.text+0x71c): undefined reference to
Pa_Sleep' paex_record.c:(.text+0x728): 未定义引用Pa_IsStreamActive'
paex_record.c:(.text+0x74e): undefined reference to
Pa_CloseStream' paex_record.c:(.text+0x77d): 未定义引用Pa_Terminate'
paex_record.c:(.text+0x7e5): undefined reference to
Pa_GetErrorText' …
我有一个 pdf 文件(下面给出了其中的一部分),并且想从中提取文本。我使用过 PDFTextStream,但它不适用于此文件。(但是它可以与其他具有简单文本的文件一起使用)。
还有哪些其他 OCR 库能够做到这一点?
请帮忙。谢谢。