相关疑难解决方法(0)

struct.error:unpack需要长度为4的字符串参数

Python说我需要4个字节的格式代码为"BH":

struct.error: unpack requires a string argument of length 4
Run Code Online (Sandbox Code Playgroud)

这是代码,我认为需要3个字节:

major, minor = struct.unpack("BH", self.fp.read(3))
Run Code Online (Sandbox Code Playgroud)

"B"无符号字符(1字节)+"H"无符号短(2字节)= 3字节(!?)

struct.calcsize("BH")表示4个字节.

编辑:文件大约800 MB,这是在文件的前几个字节,所以我很确定还有剩余的数据需要读取.

python struct

21
推荐指数
2
解决办法
9万
查看次数

PDFminer空输出

使用pdfminer(pdf2txt.py)处理文件时,我收到空输出:

dan@work:~/project$ pdf2txt.py  docs/homericaeast.pdf 

dan@work:~/project$ 
Run Code Online (Sandbox Code Playgroud)

任何人都可以说这个文件有什么问题,我可以做些什么来从中获取数据?

这是dumppdf.py docs/homericaeast.pdf输出:

<trailer>
<dict size="4">
<key>Info</key>
<value><ref id="2" /></value>
<key>Root</key>
<value><ref id="1" /></value>
<key>ID</key>
<value><list size="2">
<string size="16">on&#10;&#164;&#181;F&#164;5&#193;&#62;&#243;_&#253;v&#172;`</string>
<string size="16">on&#10;&#164;&#181;F&#164;5&#193;&#62;&#243;_&#253;v&#172;`</string>
</list></value>
<key>Size</key>
<value><number>27</number></value>
</dict>
</trailer>

<trailer>
<dict size="4">
<key>Info</key>
<value><ref id="2" /></value>
<key>Root</key>
<value><ref id="1" /></value>
<key>ID</key>
<value><list size="2">
<string size="16">on&#10;&#164;&#181;F&#164;5&#193;&#62;&#243;_&#253;v&#172;`</string>
<string size="16">on&#10;&#164;&#181;F&#164;5&#193;&#62;&#243;_&#253;v&#172;`</string>
</list></value>
<key>Size</key>
<value><number>27</number></value>
</dict>
</trailer>
Run Code Online (Sandbox Code Playgroud)

python pdf pdf-parsing pdfminer

6
推荐指数
1
解决办法
1067
查看次数

标签 统计

python ×2

pdf ×1

pdf-parsing ×1

pdfminer ×1

struct ×1