小编qua*_*ben的帖子

使用Bokeh禁用轴上的科学记数法

如何禁用散景中轴上的数字的科学输出?例如,我想要400000而不是4.00e + 5

在mpl: ax.get_xaxis().get_major_formatter().set_scientific(False)

python plot bokeh

21
推荐指数
2
解决办法
4844
查看次数

在Google Cloud Builder中获取标签

在新创建的Google容器构建器中,我无法在构建期间获取git标记.在构建过程中,默认克隆似乎不会获取git标记.我添加了一个调用的自定义构建过程,git fetch --tags但这会导致错误:

Fetching origin git: 'credential-gcloud.sh' is not a git command. See 'git --help'. fatal: could not read Username for 'https://source.developers.google.com': No such device or address

# cloudbuild.yaml
#!/bin/bash

openssl aes-256-cbc -k "$ENC_TOKEN" -in gcr_env_vars.sh.enc -out gcr_env_vars.sh -
source gcr_env_vars.sh
env
git config --global url.https://${CI_USER_TOKEN}@github.com/.insteadOf git@github.com:

pushd vendor
git submodule update --init --recursive
popd

docker build -t gcr.io/project-compute/continuous-deploy/project-ui:$COMMIT_SHA -f /workspace/installer/docker/ui/Dockerfile .
docker build -t gcr.io/project-compute/continuous-deploy/project-auth:$COMMIT_SHA -f /workspace/installer/docker/auth/Dockerfile .
Run Code Online (Sandbox Code Playgroud)

google-compute-engine google-container-registry

8
推荐指数
1
解决办法
721
查看次数

SQLAlchemy 的更新和表继承问题

我正在构建一个如下所示的继承表架构:

规格代码

class Person(Base):
    __tablename__ = 'people'
    id = Column(Integer, primary_key=True)
    discriminator = Column('type', String(50))
    updated = Column(DateTime, server_default=func.now(), onupdate=func.now())
    name = Column(String(50))
    __mapper_args__ = {'polymorphic_on': discriminator}

class Engineer(Person):
    __mapper_args__ = {'polymorphic_identity': 'engineer'}
    start_date = Column(DateTime)

class Manager(Person):
    __mapper_args__ = {'polymorphic_identity': 'manager'}
    start_date = Column(DateTime)
Run Code Online (Sandbox Code Playgroud)

更新(工作)代码

import os
import sys

from sqlalchemy import Column, create_engine, ForeignKey, Integer, String, DateTime

from sqlalchemy.orm import sessionmaker
from sqlalchemy.sql import func
from sqlalchemy.ext.declarative import declarative_base


try:
   os.remove('test.db')
except FileNotFoundError:
   pass 

engine = create_engine('sqlite:///test.db', echo=True) …
Run Code Online (Sandbox Code Playgroud)

python sql sqlite inheritance sqlalchemy

6
推荐指数
0
解决办法
538
查看次数

YARN Container在被杀后有潜在的进程

我一直在玩分布式shell示例,我注意到当我杀死长时间运行的应用程序时,该过程仍然存在.例如,如果我sleep 1000在容器启动几秒后使用命令终止了一个distshell应用程序,则仍会显示一个进程

yarn        33138   0.0  0.0  2432752    508   ??  S    12:20PM   0:00.00 sleep 1000
Run Code Online (Sandbox Code Playgroud)

我认为YARN会对清理子进程有好处吗?也许这仅适用于JAVA流程?

containers kill hadoop-yarn

5
推荐指数
0
解决办法
79
查看次数

来自客户端的 YARN ContainerID

在客户端提交 appContext 后,是否可以从 YARN 客户端获取各种容器 ID 和主机名?我想这意味着在分配容器后可以将信息传送回客户端吗?

如果这是不可能的,RM Web 界面是否提供此信息?

hadoop hadoop-yarn

4
推荐指数
1
解决办法
1224
查看次数

使用 Zarr 存储 1TB 随机数据的有效方式

我想在磁盘阵列上存储由 zarr 支持的 1TB 随机数据。目前,我正在做如下事情:

import numpy as np
import zarr
from numcodecs import Blosc

compressor = Blosc(cname='lz4', clevel=5, shuffle=Blosc.BITSHUFFLE)
store = zarr.DirectoryStore('TB1.zarr')
root = zarr.group(store)
TB1 = root.zeros('data',
           shape=(1_000_000, 1_000_000),
           chunks=(20_000, 5_000),
           compressor=compressor,
           dtype='|i2')

for i in range(1_000_000): 
    TB1[i, :1_000_000] = np.random.randint(0, 3, size=1_000_000, dtype='|i2')
Run Code Online (Sandbox Code Playgroud)

这将需要一些时间——我知道如果我不总是生成1_000_000随机数而是重用数组,事情可能会得到改善,但我现在想要更多的随机性。有没有更好的方法来构建这个随机数据集?

更新 1

使用更大的 numpy 块可以加快速度:

for i in range(0, 1_000_000, 100_000): 
    TB1[i:i+100_000, :1_000_000] = np.random.randint(0, 3, size=(100_000, 1_000_000), dtype='|i2')
Run Code Online (Sandbox Code Playgroud)

numpy zarr

0
推荐指数
1
解决办法
155
查看次数