Pickle转储替换当前文件数据

Question

Pickle转储替换当前文件数据

当我使用泡菜时,它工作正常,我可以卸载任何负载.

问题是如果我关闭程序并尝试再次转储,它会用新转储替换旧文件数据.这是我的代码:

import pickle
import os
import time


dictionary = dict()


def read():
    with open('test.txt', 'rb') as f:
        a = pickle.load(f)
    print(a)
    time.sleep(2)


def dump():
    chs = raw_input('name and number')
    n = chs.split()
    dictionary[n[0]] = n[1]
    with open('test.txt', 'wb') as f:
        pickle.dump(dictionary, f)


Inpt = raw_input('Option : ')
if Inpt == 'read':
    read()
else:
    dump()

Run Code Online (Sandbox Code Playgroud)

Answer 1

aba*_*ert 8

当您以w模式(或wb)打开文件时,它会告诉它写一个全新的文件,删除已存在的文件.

正如文档所说:

最常用的模式值是'r'用于读取,'w'用于写入(截断文件,如果它已经存在),'a'用于追加...

换句话说,你想要使用'ab',而不是'wb'.

但是,当您将新转储附加到同一文件时,最终会得到一个由多个单独值组成的文件.如果你只拨打load一次,它就会加载第一个.如果要加载所有这些,则需要编写执行此操作的代码.例如,你可以load循环直到EOFError.

真的,它看起来就像你正在试图做的是不追加到泡菜文件,而是修改了现有的腌制字典.

您可以使用将所有转储加载并合并在一起的函数来执行此操作,如下所示:

def Load():
    d = {}
    with open('test.txt', 'rb') as f:
        while True:
            try:
                a = pickle.load(f)
            except EOFError:
                break
            else:
                d.update(a)
    # do stuff with d

Run Code Online (Sandbox Code Playgroud)

但是,当您运行程序的次数越来越多时,这将越来越慢,因为您会堆积越来越多的相同值的副本.要做到这一点正确的,你需要加载的旧字典,修改,然后倾倒在修改后的版本.为此,你想要 w模式.

但是,一个更好的方法来保持字典,至少如果键是字符串,是使用dbm(如果值也是字符串)或shelve(否则)而不是字典.

Answer 2

Max*_*oel -2

在模式下打开文件"wb"会截断文件——也就是说，它会删除文件的内容，然后允许您对其进行处理。

通常，您会以追加 ( ) 模式打开文件"ab"以在末尾添加数据。-o test.txt但是，Pickle 不支持追加，因此每次程序时您都必须将数据保存到新文件（提出不同的文件名 - 询问用户或使用命令行参数，例如？）正在运行。

在相关主题中，不要使用 Pickle。这是不安全的。考虑使用 JSON 代替（它位于标准库中 -- import json）。

你的前半部分答案是正确的……但后半部分则不然。Pickle 确实支持附加。至于“不安全”，如果你试图保存 float/str/list/dict 之外的类型，JSON 就无法做到这一点，除非你扩展它，在这种情况下它就变得和 pickle 一样不安全。您必须了解您的数据以及您想要如何存储它，否则没有通用的安全答案。 (2认同)
更一般地说：“pickle”显然不是解决所有问题的灵丹妙药。但它也不是一个完全无用、永远不应该使用的模块。如果是的话，它就不会出现在标准库中。无缘无故地传播 FUD 对任何人都没有任何好处。 (2认同)

归档时间：	11 年，10 月前
查看次数：	13061 次
最近记录：	8 年，1 月前