我正在寻找与 Azure 中的 Cloud Run(GCP 产品)等效的产品
尤其:
Azure有这样的服务吗?
我正在研究 Azure App Service,但它似乎缺少缩小到 0 的能力。
azure google-cloud-platform azure-web-app-service google-cloud-run
我正在构建一个streamlit带有图表的应用程序plotly。但是,我发现很难在图中设置动态绘图宽度plotly(我希望以多种分辨率查看该应用程序)。
有没有办法告诉plotly使用宽度的 100%(或 80% 等)(无论像素数量是多少)。
我有一个pyproject.toml包含一些 python 包的文件。
它有一个像这样的部分:
dependencies = [
'pandas == 1.4.3',
'streamlit == 1.11.1',
...
]
Run Code Online (Sandbox Code Playgroud)
然后我通常使用安装这些依赖项
python -m pip install .[dependencies]
我需要安装一个新软件包,该软件包的依赖项之一存在冲突。我查了一下,“冲突”是肤浅的 - 即。新包的维护者只是“忘记”更新requirements.txt以允许pandas>=1.4。
我可以通过运行来做到这一点python -m pip install {new_package} --no-deps
但是有什么办法可以在pyproject.toml文件中做到这一点吗?
我们运行 Azure SQL 数据库(无服务器)作为 PoC 的一部分。我们现在正在测试一些其他解决方案,因此我们想强制数据库暂停几天。IE。我们只想支付几天的存储费用。
数据库显示的使用量较低,导致数据库表单自动暂停(导致持续计费,符合与数据库存储使用相关的最小 vCore)
如何强制无服务器数据库暂停?
我喜欢 Azure 容器应用服务,但我们正在努力应对每个容器 4GB 的限制。
有没有办法在不切换到容器实例的情况下增加此限制?
我正在寻找创建一个注释丰富的代码库。我记得Python中的函数是对象,因此它们允许任意属性。例如:
def foo(x:int, y:int)->int:
'''This is a doc string'''
return x**2 + y**2
foo.__notes__ = {
'Dependencies':['x', 'y']
}
foo.__notes__
>>> {'Dependencies': ['x', 'y']}
Run Code Online (Sandbox Code Playgroud)
我正在寻找__notes__从函数定义中设置属性。关于如何实现这一目标有什么想法吗?
编辑:正如评论中所指出的,__notes__这个属性的名字很糟糕。_notes更合适。
将特定函数应用于特定列的最佳 pandas 方法是什么?
让
df = pd.DataFrame({'A':[1,2,3], 'B':[1,2,3], 'C':[1,2,3]})
Run Code Online (Sandbox Code Playgroud)
假设我想将column中的值加倍'A'并将column中的值减半'B',并保持column'C'不变。
我知道我能做到
df['A'] = df['A'] * 2
df['B'] = df['B'] / 2
Run Code Online (Sandbox Code Playgroud)
但我正在寻找允许方法链接的东西。
这很接近:
df.apply({'A':lambda x: x*2, 'B':lambda x: x/2})
Run Code Online (Sandbox Code Playgroud)
但默认情况下它会删除列'C'
我知道的另一种选择是滥用该.assign方法。IE
df.assign(**{'A':lambda x: x['A']*2, 'B':lambda x: x['B']/2})
Run Code Online (Sandbox Code Playgroud)
但我确信 Pandas 有一种方法可以实现我想要做的事情。
我对极坐标表达式语法非常满意,以至于我的很多特征工程都是用极坐标表达式来表达的。
但是,我现在尝试将功能工程转移到 JSON 或 YAML 文件(出于 MLOps 原因)。
问题是 - 我如何将其编码为 JSON 文件:
configuration = {
'features': [
pl.col('col1').fill_null(0).log().le(0.2).alias('feature1'),
pl.col('col2').fill_null(0).log().le(0.2).alias('feature2'),
pl.col('col3').fill_null(0).log().le(0.2).alias('feature3')
],
'filters': [
pl.col('col4') >= 500_000,
pl.col('col5').is_in(['A', 'B'])
]
}
# This is how I use it - just for context
X = (df
.filter(pl.all(configuration['filters']))
.select(configuration['features'])
)
Run Code Online (Sandbox Code Playgroud)
关于如何将其序列化(或重写)为 JSON 以便将其转换回 Polars 表达式的任何想法?
请注意,这个问题与Maybe to Stringize a Polars Expression?有很多重叠。,但它不是重复的。
我有两个大表,我正在尝试使用 dbt 连接和过滤。
SQL很简单,大致如下:
SELECT
u.user_id, t.transaction_id
FROM users u
JOIN transactions t ON t.user_id = u.user_id
WHERE u.active = 1
Run Code Online (Sandbox Code Playgroud)
目前我正在使用“表”具体化,但这相当浪费,因为表底层的表在每次运行时都是 99.99% 相同的。
但是,我从 DBT 文档中不明白如何将此模型设置为“增量”。
有任何想法吗?
附言。我在 SQL Server 上运行。