小编Sar*_*ers的帖子

从Python打开megawarc存档时出错

我发现自己必须使用python脚本来访问webarchive.

我所拥有的是来自http://archive.org/details/archiveteam-fanfiction-warc-11的'megawarc'网络档案文件.我需要使用https://github.com/alard/megawarc上的python脚本来解决这个问题.

我正在尝试运行'restore'命令,我从第一个链接获得了所需的三个文件(FILE.warc.gz,FILE.tar和FILE.json.gz).

我安装了python 2.7和3.3.

-------------- --------------更新

我跑了这个方法..

python megawarc restore FILE
Run Code Online (Sandbox Code Playgroud)

而这个方法..

确保在同一目录中包含文件megawarc和ordereddict.py,以及要转换的文件.将文件megawarc重命名为megawarc.py在此目录中打开python控制台

Type the following code (line by line) :

import sys
sys.argv = ['megawarc','restore','FILE']
import megawarc
megawarc.main()
Run Code Online (Sandbox Code Playgroud)

使用python 2.7,这就是我得到的..

c:\Python27>python megawarc restore FILE
Traceback (most recent call last):
  File "megawarc", line 563, in <module>
main()
  File "megawarc", line 552, in main
mwr.process()
  File "megawarc", line 460, in process
self.process_entry(entry, tar_out)
  File "megawarc", line 478, in process_entry
entry["target"]["offset"], entry["target"]["size"])
  File "megawarc", line 128, in …
Run Code Online (Sandbox Code Playgroud)

python python-2.7

10
推荐指数
1
解决办法
566
查看次数

标签 统计

python ×1

python-2.7 ×1