OnS*_*ike 7 python dictionary class namedtuple
我发现自己避免使用字典,因为通常,将近一半的代码是重复的.我通常在嵌套字典中执行此操作,其中所有子字典包含相同的键,但具有不同的值.
我手动创建一个大型父字典,其中每个键包含一个嵌套字典,用于外部模块.嵌套字典都使用相同的键来定义配置参数.这种用法是明确的并且有效但是为我手动创建的每个嵌套字典重新键入或复制/粘贴密钥感觉很愚蠢.我并不过分担心优化内存或性能,只是想知道我是否应该这样做,更多Pythonic方式.
作为一个简单的例子和模式经常看到:
people_dict = {
"Charles Lindberg": {"address": "123 St.",
"famous": True},
"Me": {"address": "456 St.",
"famous": False}
}
>>>people_dict["Charles Lindberg"]["address"]
"123 St."
Run Code Online (Sandbox Code Playgroud)
虽然字典启用了显式代码,但是使用重复键定义嵌套字典会很繁琐且容易出错.在此示例中,嵌套字典的一半是所有嵌套字典共有的代码重复代码.我已经尝试使用元组来消除重复的密钥但发现这导致了脆弱的代码 - 位置的任何变化(而不是字典键)都会失败.这也导致代码不明确且难以遵循.
people_dict = {
"Charles Lindberg": ("123 St.", True),
"Me": ("456 St.", False),
}
>>>people_dict["Charles Lindberg"][0]
"123 St."
Run Code Online (Sandbox Code Playgroud)
相反,我编写了一个类来封装相同的信息:这成功地减少了重复代码......
class Person(object):
def __init__(self, address, famous=False):
self.address = address
self.famous = famous
people_dict = [
"Charles Lindberg": Person("123 St.", famous=False),
"Me": Person("456 St."),
]
>>>people_dict["Charles Lindberg"].address
"123 St."
Run Code Online (Sandbox Code Playgroud)
创建一个类似乎有点矫枉过正......标准数据类型似乎太基础了......
听起来你有一个数据矩阵,因为每个“行”都有相同的键(列),所以我会使用一个 NumPy 数组:
import numpy as np
dtype = [('name', object), ('address', object), ('famous', bool)]
people = np.array([
("Charles Lindberg", "123 St.", True),
("Me", "456 St.", False),
], dtype)
charlie = people[people['name'] == 'Charles Lindberg'][0]
print charlie['address']
Run Code Online (Sandbox Code Playgroud)
或者使用更高级的 Pandas:
import pandas as pd
people = pd.DataFrame(people_dict)
print people['Charles Lindberg']['address']
Run Code Online (Sandbox Code Playgroud)
这people_dict很容易将原始dict-of-dicts直接加载到矩阵中,并为您提供类似的查找功能。