我想通过SQLAlchemy从不同的进程执行相同的SQL查询.据我所知,我必须在每个过程中创建新的Session.因此,对于每个新会话,我必须重新创建查询:
session.query(...).filter(...)
etc.
Run Code Online (Sandbox Code Playgroud)
将完全形成的查询与会话分开保存似乎是合乎逻辑的.然后只将此查询应用于每个会话:
new_session.query(old_saved_query)
Run Code Online (Sandbox Code Playgroud)
可能吗?还是有其他方式?
有时将__init__现有对象用作初始化方法看起来是合理的,即:
class A():
def __init__(self, x):
self.x = x
def set_state_from_file(self, file):
x = parse_file(file)
self.__init__(x)
Run Code Online (Sandbox Code Playgroud)
作为此实现的替代,我看到以下内容:
class A():
def __init__(self, x):
self.init(x)
def init(self, x):
self.x = x
def set_state_from_file(self, file):
x = parse_file(file)
self.init(x)
Run Code Online (Sandbox Code Playgroud)
在我看来,代码过于复杂.这种情况有什么指导方针吗?
据我了解,Dask DataFrame 是处理表格数据的正确方法。我在 PostgreSQL 中有一个表,我知道如何将它加载到pandas.Dataframe.
我知道,odo可用于转换pandas.DataFrame为 dask.dataframe。但这不是懒惰的操作:这种转换强制将整个 PostgeSQL 表加载到内存中,这很糟糕。我更喜欢一个一个或一个块地阅读项目。这该怎么做?
我对使用 Dask Distributed 作为任务执行器很感兴趣。在 Celery 中,可以将任务分配给特定的工作人员。如何使用 Dask 分布式?
python ×3
cassandra ×1
dask ×1
dataframe ×1
pep8 ×1
postgresql ×1
python-3.4 ×1
session ×1
sqlalchemy ×1