小编Skl*_*vit的帖子

SQLAlchemy:是否可以在不受会话限制的情况下运行Query?

我想通过SQLAlchemy从不同的进程执行相同的SQL查询.据我所知,我必须在每个过程中创建新的Session.因此,对于每个新会话,我必须重新创建查询:

session.query(...).filter(...)
etc.
Run Code Online (Sandbox Code Playgroud)

将完全形成的查询与会话分开保存似乎是合乎逻辑的.然后只将此查询应用于每个会话:

new_session.query(old_saved_query)
Run Code Online (Sandbox Code Playgroud)

可能吗?还是有其他方式?

python session sqlalchemy python-3.4

7
推荐指数
1
解决办法
2126
查看次数

可以__init__用作初始化的常规方法,而不是构造函数?

有时将__init__现有对象用作初始化方法看起来是合理的,即:

class A():
    def __init__(self, x):
        self.x = x

    def set_state_from_file(self, file):
        x = parse_file(file)
        self.__init__(x)
Run Code Online (Sandbox Code Playgroud)

作为此实现的替代,我看到以下内容:

class A():
    def __init__(self, x):
        self.init(x)        

    def init(self, x):
        self.x = x

    def set_state_from_file(self, file):
        x = parse_file(file)
        self.init(x)
Run Code Online (Sandbox Code Playgroud)

在我看来,代码过于复杂.这种情况有什么指导方针吗?

python design-patterns initialization pep8

7
推荐指数
2
解决办法
435
查看次数

懒惰地从 PostgreSQL / Cassandra 创建 Dask DataFrame

据我了解,Dask DataFrame 是处理表格数据的正确方法。我在 PostgreSQL 中有一个表,我知道如何将它加载到pandas.Dataframe.

我知道,odo可用于转换pandas.DataFrame为 dask.dataframe。但这不是懒惰的操作:这种转换强制将整个 PostgeSQL 表加载到内存中,这很糟糕。我更喜欢一个一个或一个块地阅读项目。这该怎么做?

  1. 卡桑德拉的类似问题。但是 Cassandra 就像分布式存储,可以针对分布式访问进行优化。但是如何用 Dask 做到这一点?

python postgresql cassandra dataframe dask

6
推荐指数
1
解决办法
1112
查看次数

如何在 Dask.Distributed 中将任务分配给特定工作人员

我对使用 Dask Distributed 作为任务执行器很感兴趣。在 Celery 中,可以将任务分配给特定的工作人员。如何使用 Dask 分布式?

dask-distributed

5
推荐指数
1
解决办法
1570
查看次数