Python的列表推导和其他更好的实践

The*_*ate 3 python arrays statistics list python-2.6

这涉及将SAS中的双向ANOVA程序转换为Python的项目.

我周四开始尝试学习这门语言,所以我知道我还有很大的提升空间.如果我遗漏一些明显的东西,请务必告诉我.我还没有Sage运行起来,也没有numpy,所以现在,这些都是非常普通的Python 2.6.1.(便携式)

主查询:需要一个好的集列表解析可以由因子B,整体,并且在因子A&B(AXB)的每个电平的基团通过因子A提取样本的列表中的数据以列表,的.

完成一些工作后,数据采用以下形式(3层嵌套列表):

反应[A] [B] [n]的

(意思是:〔A1 [B1 [N1,...,N] ... [BB [N1,... NN]],...,AA [B1 [N1,...,N] .. .[bB [n1,... nN]]]希望这很清楚.)

我的例子中的因子水平:A = 3(0-2),B = 8(0-7),N = 8(0-7)

byA= [[a[i] for i in range(b)] for a[b] in response]
Run Code Online (Sandbox Code Playgroud)

(有人可以解释为什么这句法的作品?我偶然到它想看看解析器会接受.我还没有看到连接到其他地方行为的语法,但它是非常好的.关于该主题网站或书籍的任何好的链接编辑:运行之间变量的持久性解释了这种奇怪.它不起作用.)

byB=lstcrunch([[Bs[i] for i in range(len(Bs)) ]for Bs in response])
Run Code Online (Sandbox Code Playgroud)

(值得注意的是,zip(*response)几乎可以做我想要的.上面的版本实际上并没有工作,我记得.我还没有通过仔细的测试.)

byAxB= [item for sublist in response for item in sublist]
Run Code Online (Sandbox Code Playgroud)

(从Alex Martelli在本网站上的回复中窃取.再次有人可以解释为什么?列表理解语法在我读过的文本中没有得到很好的解释.)

ByO= [item for sublist in byAxB for item in sublist]
Run Code Online (Sandbox Code Playgroud)

(显然,我只是重复使用前面的理解,因为它做了我需要的.编辑:)

我想这些落得相同的数据类型,所讨论通过由因子环至少当,ST相同的平均/和/ SS /等等的功能可以应用和使用.

这很容易被更清洁的东西取代:

def lstcrunch(Dlist):
    """Returns a list containing the entire
    contents of whatever is imported,
    reduced by one level.

    If a rectangular array, it reduces a dimension by one.
    lstcrunch(DataSet[a][b]) -> DataOutput[a]
    [[1, 2], [[2, 3], [2, 4]]] -> [1, 2, [2, 3], [2, 4]]
    """
    flat=[]
    if islist(Dlist):#1D top level list
        for i in Dlist:
            if islist(i):
                flat+= i
            else:
                flat.append(i)
        return flat
    else:
        return [Dlist]
Run Code Online (Sandbox Code Playgroud)

哦,当我谈论这个主题时,将变量识别为列表的首选方法是什么?我一直在使用:

def islist(a):
    "Returns 'True' if input is a list and 'False' otherwise"
    return type(a)==type([])
Run Code Online (Sandbox Code Playgroud)

分手查询:有没有办法明确强制浅拷贝转换为深?复制?或者,类似地,当复制到变量时,有没有办法声明赋值也应该替换指针,而不仅仅是值?(分配不会传播到其他浅层副本)同样,使用它也可能是有用的,不时,所以能够控制它何时发生或不发生声音真的很好.(当我通过调用准备我的表格插入时,我真的全身心投入:response = [[[0]*N]*B]*A)

编辑:进一步调查导致大部分工作正常.我已经上课并测试了它.它工作正常.我将保留列表理解表格以供参考.

def byB(array_a_b_c):
    y=range(len(array_a_b_c))
    x=range(len(array_a_b_c[0]))
    return [[array_a_b_c[i][j][k]
    for k in range(len(array_a_b_c[0][0]))
    for i in y]
    for j in x]


def byA(array_a_b_c):
    return [[repn for rowB in rowA for repn in rowB] 
    for rowA in array_a_b_c]

def byAxB(array_a_b_c):
    return [rowB for rowA in array_a_b_c 
    for rowB in rowA]

def byO(array_a_b_c):
    return [rep
    for rowA in array_a_b_c
    for rowB in rowA
    for rep in rowB]


def gen3d(row, col, inner):
"""Produces a 3d nested array without any naughty shallow copies.

[row[col[inner]] named s.t. the outer can be split on, per lprn for easy display"""
    return [[[k for k in range(inner)]
    for i in range(col)]
    for j in range(row)]

def lprn(X):
    """This prints a list by lines.

    Not fancy, but works"""
    if isiterable(X):
        for line in X: print line
    else:
        print x

def isiterable(a):
    return hasattr(a, "__iter__")
Run Code Online (Sandbox Code Playgroud)

感谢大家的回应.由于我的gnosis改进,已经看到代码质量明显改善.当然,还有进一步的想法.

Man*_*dan 6

byAxB= [item for sublist in response for item in sublist] 有人可以解释为什么吗?

我相信AM能够给你一个很好的解释.这是我在等待他出现时的刺痛.

我会从左到右接近这个.拿这四个字:

for sublist in response
Run Code Online (Sandbox Code Playgroud)

我希望你能看到与常规for循环的相似之处.这四个字在做用于对每个动作的一些基础工作sublistresponse.它似乎response是一个列表列表.在这种情况下,sublist将是每次迭代的列表response.

for item in sublist
Run Code Online (Sandbox Code Playgroud)

这又是另一个for循环.鉴于我们sublist在之前的"循环"中首次听到这一点,这表明我们现在正在遍历子列表,一次item一个.如果我在没有理解的情况下编写这些循环,它将如下所示:

for sublist in response:
    for item in sublist:
Run Code Online (Sandbox Code Playgroud)

接下来,我们看看剩下的单词.[,item].这实际上意味着,收集列表中的项目并返回结果列表.

每当您在创建或理解列表迭代时遇到问题,请写出相关的for循环,然后压缩它们:

result = []

for sublist in response:
    for item in sublist:
        result.append(item)
Run Code Online (Sandbox Code Playgroud)

这将压缩为:

[
    item 
    for sublist in response
    for item in sublist
]
Run Code Online (Sandbox Code Playgroud)

列表理解语法在我读过的文本中没有得到很好的解释

Dive Into Python有一个专门用于列表推导的部分.还有这个很好的教程可供阅读.

更新

我忘了说些什么.列表理解是实现传统上使用map和完成的另一种方式filter.这将是一个好主意,了解mapfilter工作,如果你想提高你的理解福.