小编MRo*_*lin的帖子

将numpy数据类型与字符串进行比较

许多numpy函数将dtype参数作为字符串(如"float64")或numpy数据类型(如numpy.float64)或甚至python数据类型(如float).

我需要比较两种数据类型,并希望支持这种灵活的接口.是否存在所有这些形式都相同的功能?即我想要的最小功能f,使得

f("float64") == f(numpy.float64) == f(float)

numpy在内部使用什么?

python numpy

4
推荐指数
2
解决办法
2909
查看次数

从Bokeh Plot中删除所有填充

如何删除散景图周围的所有空白?

我使用Bokeh绘图界面为我的项目生成带有progressbars的以下图像:

在此输入图像描述

从各种其他堆栈溢出问题,我可以弄清楚如何关闭网格线,刻度线,标签.但是我还没弄清楚如何干净地去除所有水平和垂直填充.

除了我明确添加的内容之外,什么是从画布中删除所有可视元素和填充的全面内容?

python bokeh

4
推荐指数
1
解决办法
3014
查看次数

使用xonsh使用ls循环文件

我想用xonsh来压缩目录中的几个文件.我首先尝试以下方法:

$ ls
table_aa.csv    table_amgn.csv  table_csco.csv  table_esrx.csv  table_hal.csv  table_jbl.csv  table_pcg.csv   table_zmh.csv
table_aapl.csv  table_amzn.csv  table_d.csv     table_gas.csv   table_hp.csv   table_jpm.csv  table_usb.csv
$ for fn in ls:
..    bzip2 fn
..
NameError: name 'ls' is not defined
Run Code Online (Sandbox Code Playgroud)

好的,所以我$()明确使用

$ for fn in $(ls).split():
.     bzip2 fn
bzip2: Can't open input file fn: No such file or directory.
bzip2: Can't open input file fn: No such file or directory.
Run Code Online (Sandbox Code Playgroud)

有一个更好的方法吗?

$ xonsh --version
('xonsh/0.3.4',)
Run Code Online (Sandbox Code Playgroud)

xonsh

4
推荐指数
1
解决办法
607
查看次数

分支或分叉 Conda 环境

我想以不同的名称复制 conda 环境。

我有一个我喜欢的 conda 环境。我想创建一个带有副本的新环境,以便我可以进行一些实验性编辑。在git说法我正在寻找branchcheckout -b

  • 请问这样的branchfork功能存在于畅达?

  • 如果不是,今天最好的解决方法是什么?

conda

4
推荐指数
2
解决办法
854
查看次数

在 dask 产生的进程中调用 dask

我们有一个包含众多任务的大型项目。我们使用 dask 图来安排每个任务。该图的一个小样本如下。请注意,dask 设置为多处理模式。

dask_graph:

  universe: !!python/tuple [gcsstrategies.svc.business_service.UniverseService.load_universe_object, CONTEXT]
  raw_market_data: !!python/tuple [gcsstrategies.svc.data_loading_service.RDWLoader.load_market_data, CONTEXT, universe]
  raw_fundamental_data: !!python/tuple [gcsstrategies.svc.data_loading_service.RDWLoader.load_fundamental_data, CONTEXT, universe]

dask_keys: [raw_fundamental_data]
Run Code Online (Sandbox Code Playgroud)

现在的任务之一,raw_fundamental_data懒洋洋地安排使用DASK任务,@delay并使用游dask.compute()。这种设计选择的原因是将raw_fundamental_data在运行时根据运行时参数动态选择由 dask inside 调度和延迟运行的任务列表。

我们看到的错误是:

守护进程不允许有子进程

我们理解这是因为生成的进程试图生成子进程。这个问题有什么解决办法吗?dask 是否有任何方法允许通过 daskgraph 安排的任务使用@delay或其他方法来安排和延迟运行自己的任务。

请注意,在我们的系统中,有许多任务将使用多处理运行自己的任务。所以顺序执行不是一种选择。

python multiprocessing dask

4
推荐指数
1
解决办法
661
查看次数

Dask 因 freeze_support 错误而失败

我尝试运行一个非常简单的 Dask 程序,如下所示:

# myfile.py
from dask.distributed import Client

client = Client()
Run Code Online (Sandbox Code Playgroud)

但是当我运行这个程序时,我得到了这个奇怪的错误

    An attempt has been made to start a new process before the
    current process has finished its bootstrapping phase.

    This probably means that you are not using fork to start your
    child processes and you have forgotten to use the proper idiom
    in the main module:

        if __name__ == '__main__':
            freeze_support()
            ...

    The "freeze_support()" line can be omitted if the program
    is not going to be frozen …
Run Code Online (Sandbox Code Playgroud)

python python-multiprocessing dask

4
推荐指数
1
解决办法
1116
查看次数

在MongoDB中,如何将epoch之后的秒数转换为Datetimes?

在MongoDB中,如何在查询之后将秒数转换为日期时间?

我正在寻找相当于以下Python函数

In [10]: datetime.utcfromtimestamp(1000000000)
Out[10]: datetime.datetime(2001, 9, 9, 1, 46, 40)
Run Code Online (Sandbox Code Playgroud)

我明白直接插入日期时间会更好,遗憾的是这不是我的情况.

特别是我正在使用聚合管道查询系统,因此最适合该框架的东西更可取.

datetime mongodb

3
推荐指数
1
解决办法
5903
查看次数

对齐Bokeh DataTable列宽

我有一个散景DataTable

在此输入图像描述

如您所见,列的宽度都相同.这导致了相当数量的空白和一些削波.有没有办法可以指定默认列宽?

bokeh

3
推荐指数
1
解决办法
2725
查看次数

使用 Dask 从文件系统/S3 并行读取文件块?

我正在整理一个概念证明,其中我想使用 PyCuda 在分布式环境中处理大型字符数据文件(每个任务一个文件中约 8GB) - 具体来说是 AWS。我知道 HDFS 会对数据文件进行分段并将其分发给工作人员,但我试图让我的环境尽可能简单,并且如果我不需要,我宁愿不必安装 Hadoop。

我最近观看了 Continuum Analytics 的一些关于他们的 Dask 框架的网络研讨会,看起来它可以完全满足我的需求。鉴于上述段落和 Dask 框架,当前对文件系统的推荐是什么?我是坚持使用 HDFS 还是有更好/更简单的解决方案?

distributed-computing dask

3
推荐指数
1
解决办法
1627
查看次数

将Bokeh Glyph转换为链接

我想将某个绘图上的所有Bokeh字形转换为其他页面的链接.这可能吗?

例如,如果我有一个国家/地区的地图,每个国家/地区都作为补丁,如果用户点击某个国家/地区,我想将其重定向到该维基百科页面.

python bokeh

3
推荐指数
1
解决办法
5252
查看次数