从 LevelDB“.ldb”文件恢复数据

ff0*_*f03 6 python go leveldb

我正在尝试从 .ldb 文件中提取数据。Chrome 扩展 OneTab 出现故障,我正在尝试恢复它保存的链接。我相信我已经从一篇旧的博客文章中找到了解决方案,但我对编码了解不够,无法弄清楚如何遵循。

以下是博客文章的链接: https://antimatter15.com/2015/12/recovering-deleted-data-from-leveldb/

我相信我已经按照他的建议正确完成了构建 Go 应用程序的所有操作。它创建了一个名为“ldbdump”的文件,没有文件扩展名。下一步是我遇到麻烦的地方。我尝试在 Jupyter Notebook 中运行他的 Python 代码(这是我唯一使用过 Python 的软件,而且经验有限),但只会出现错误。

我正在使用的原始代码可以在上面的“恢复”标题下的链接中找到。我将“base”的定义从“test-stuff copy”更改为指向包含我尝试读取的 .ldb 文件以及“ldbdump”文件的文件夹。出现错误后,我还更改了底部打印命令的语法。其他一切都被搁置了。

base = "D:\\Downloads\\ldb archive"

import os
from subprocess import Popen, PIPE
import json
import ast

for f in os.listdir(base):
  if f.endswith(".ldb"):
    process = Popen(["ldbdump", os.path.join(base, f)], stdout=PIPE)
    (output, err) = process.communicate()
    exit_code = process.wait()
    for line in (output.split("\n")[1:]):
      if line.strip() == "": continue
      parsed = ast.literal_eval("{" + line + "}")
      key = parsed.keys()[0]
      print(json.dumps({ "key": key.encode('string-escape'), "value": parsed[key] }))
Run Code Online (Sandbox Code Playgroud)

如果我正确理解该博客文章,则应该在将 .ldb 文件的内容转换为 JSON 文件后打印该文件的内容(尽管我不确定该 JSON 文件将保存在哪里)。之后,我可以继续下一步,清理结果以使其更具可读性。相反,我收到一个错误。我不知道我做错了什么,因为我一开始几乎不知道自己在做什么。我真正理解的是顶部的“文件未找到”。它看起来像这样:

FileNotFoundError                         Traceback (most recent call last)
<ipython-input-2-26ff29e32d63> in <module>
      1 for f in os.listdir(base):
      2   if f.endswith(".ldb"):
----> 3     process = Popen(["ldbdump", os.path.join(base, f)], stdout=PIPE)
      4     (output, err) = process.communicate()
      5     exit_code = process.wait()

~\Anaconda3\lib\subprocess.py in __init__(self, args, bufsize, executable, stdin, stdout, stderr, preexec_fn, close_fds, shell, cwd, env, universal_newlines, startupinfo, creationflags, restore_signals, start_new_session, pass_fds, encoding, errors, text)
    767                                 c2pread, c2pwrite,
    768                                 errread, errwrite,
--> 769                                 restore_signals, start_new_session)
    770         except:
    771             # Cleanup if the child failed starting.

~\Anaconda3\lib\subprocess.py in _execute_child(self, args, executable, preexec_fn, close_fds, pass_fds, cwd, env, startupinfo, creationflags, shell, p2cread, p2cwrite, c2pread, c2pwrite, errread, errwrite, unused_restore_signals, unused_start_new_session)
   1170                                          env,
   1171                                          os.fspath(cwd) if cwd is not None else None,
-> 1172                                          startupinfo)
   1173             finally:
   1174                 # Child is launched. Close the parent's copy of those pipe

FileNotFoundError: [WinError 2] The system cannot find the file specified
Run Code Online (Sandbox Code Playgroud)

就像我说的,我不确定我做错了什么。我最好的猜测是,我要么没有正确修改博客文章的代码以将其指向我的电脑上的文件,要么原始代码错误地假设了有关我的机器的某些信息(意味着我有错误的操作系统,我不应该运行它在笔记本中,我缺少一些依赖项等)

作为参考,我使用的是运行 Windows 10 的台式电脑,我尝试使用 Jupyter Notebook 5.7.4 运行此代码,除了上面代码部分中列出的包之外,我没有导入任何其他包,我几乎不知道自己在做什么。对不起。请帮忙。

小智 4

在我的研究中我添加了一些修复

import os
import subprocess
import json
import ast
for f in os.listdir(base):
  if f.endswith(".ldb"):
    process = subprocess.Popen(["ldbdump", os.path.join(base, f)], stdout=subprocess.PIPE, shell = True)
    (output, err) = process.communicate()
    exit_code = process.wait()
    for line in (output.split("\n")[1:]):
      if line.strip() == "": continue
      parsed = ast.literal_eval("{" + line + "}")
      key = parsed.keys()[0]
      print json.dumps({ "key": key.encode('string-escape'), "value": parsed[key] })
Run Code Online (Sandbox Code Playgroud)