我正在使用 Ghostscript 9.20 从仅包含两行文本的 PDF 文档中提取文本:
\n\nHello world\xe2\x80\xa6\nA beautiful day!\nRun Code Online (Sandbox Code Playgroud)\n\n应用的代码是:
\n\ngswin32c -sDEVICE=txtwrite -o output.txt input.pdf\nRun Code Online (Sandbox Code Playgroud)\n\n然而,输出是:
\n\n \xe4\xa0\x80\xe6\x94\x80\xe6\xb0\x80\xe6\xb0\x80\xe6\xbc\x80\xe2\x80\x80\xe7\x9c\x80\xe6\xbc\x80\xe7\x88\x80\xe6\xb0\x80\xe6\x90\x80\xe2\x98\xa0\xe2\x80\x80\n \xe4\x84\x80\xe2\x80\x80\xe6\x88\x80\xe6\x94\x80\xe6\x84\x80\xe7\x94\x80\xe7\x90\x80\xe6\xa4\x80\xe6\x98\x80\xe7\x94\x80\xe6\xb0\x80\xe2\x80\x80\xe6\x90\x80\xe6\x84\x80\xe7\xa4\x80\xe2\x84\x80\xe2\x80\x80\nRun Code Online (Sandbox Code Playgroud)\n\n这是怎么回事?我该如何解决?
\n鉴于硬件和内存有限,我们遇到了浮点问题.我的问题是,如何进来的Python:0.1 + 0.1 + 0.1 == 0.3回报率 False,而数学返回它True?
Wolfram的人是如何管理它的,Python开发人员可以实现他们的解决方案吗?