如何禁用散景中轴上的数字的科学输出?例如,我想要400000而不是4.00e + 5
在mpl: ax.get_xaxis().get_major_formatter().set_scientific(False)
在新创建的Google容器构建器中,我无法在构建期间获取git标记.在构建过程中,默认克隆似乎不会获取git标记.我添加了一个调用的自定义构建过程,git fetch --tags
但这会导致错误:
Fetching origin
git: 'credential-gcloud.sh' is not a git command. See 'git --help'.
fatal: could not read Username for 'https://source.developers.google.com': No such device or address
# cloudbuild.yaml
#!/bin/bash
openssl aes-256-cbc -k "$ENC_TOKEN" -in gcr_env_vars.sh.enc -out gcr_env_vars.sh -
source gcr_env_vars.sh
env
git config --global url.https://${CI_USER_TOKEN}@github.com/.insteadOf git@github.com:
pushd vendor
git submodule update --init --recursive
popd
docker build -t gcr.io/project-compute/continuous-deploy/project-ui:$COMMIT_SHA -f /workspace/installer/docker/ui/Dockerfile .
docker build -t gcr.io/project-compute/continuous-deploy/project-auth:$COMMIT_SHA -f /workspace/installer/docker/auth/Dockerfile .
Run Code Online (Sandbox Code Playgroud) 我正在构建一个如下所示的继承表架构:
class Person(Base):
__tablename__ = 'people'
id = Column(Integer, primary_key=True)
discriminator = Column('type', String(50))
updated = Column(DateTime, server_default=func.now(), onupdate=func.now())
name = Column(String(50))
__mapper_args__ = {'polymorphic_on': discriminator}
class Engineer(Person):
__mapper_args__ = {'polymorphic_identity': 'engineer'}
start_date = Column(DateTime)
class Manager(Person):
__mapper_args__ = {'polymorphic_identity': 'manager'}
start_date = Column(DateTime)
Run Code Online (Sandbox Code Playgroud)
import os
import sys
from sqlalchemy import Column, create_engine, ForeignKey, Integer, String, DateTime
from sqlalchemy.orm import sessionmaker
from sqlalchemy.sql import func
from sqlalchemy.ext.declarative import declarative_base
try:
os.remove('test.db')
except FileNotFoundError:
pass
engine = create_engine('sqlite:///test.db', echo=True) …
Run Code Online (Sandbox Code Playgroud) 我一直在玩分布式shell示例,我注意到当我杀死长时间运行的应用程序时,该过程仍然存在.例如,如果我sleep 1000
在容器启动几秒后使用命令终止了一个distshell应用程序,则仍会显示一个进程
yarn 33138 0.0 0.0 2432752 508 ?? S 12:20PM 0:00.00 sleep 1000
Run Code Online (Sandbox Code Playgroud)
我认为YARN会对清理子进程有好处吗?也许这仅适用于JAVA流程?
在客户端提交 appContext 后,是否可以从 YARN 客户端获取各种容器 ID 和主机名?我想这意味着在分配容器后可以将信息传送回客户端吗?
如果这是不可能的,RM Web 界面是否提供此信息?
我想在磁盘阵列上存储由 zarr 支持的 1TB 随机数据。目前,我正在做如下事情:
import numpy as np
import zarr
from numcodecs import Blosc
compressor = Blosc(cname='lz4', clevel=5, shuffle=Blosc.BITSHUFFLE)
store = zarr.DirectoryStore('TB1.zarr')
root = zarr.group(store)
TB1 = root.zeros('data',
shape=(1_000_000, 1_000_000),
chunks=(20_000, 5_000),
compressor=compressor,
dtype='|i2')
for i in range(1_000_000):
TB1[i, :1_000_000] = np.random.randint(0, 3, size=1_000_000, dtype='|i2')
Run Code Online (Sandbox Code Playgroud)
这将需要一些时间——我知道如果我不总是生成1_000_000
随机数而是重用数组,事情可能会得到改善,但我现在想要更多的随机性。有没有更好的方法来构建这个随机数据集?
使用更大的 numpy 块可以加快速度:
for i in range(0, 1_000_000, 100_000):
TB1[i:i+100_000, :1_000_000] = np.random.randint(0, 3, size=(100_000, 1_000_000), dtype='|i2')
Run Code Online (Sandbox Code Playgroud) hadoop-yarn ×2
python ×2
bokeh ×1
containers ×1
hadoop ×1
inheritance ×1
kill ×1
numpy ×1
plot ×1
sql ×1
sqlalchemy ×1
sqlite ×1
zarr ×1