小编Dav*_*sip的帖子

无法通过 pip 安装 xmlsec

pip install xmlsec在 macOS Big Sur 11.3.1 中运行时,我收到以下信息:

Building wheels for collected packages: xmlsec
  Building wheel for xmlsec (PEP 517) ... error
  ERROR: Command errored out with exit status 1:
   command: /Users/davidmasip/.pyenv/versions/3.9.9/bin/python3.9 /Users/davidmasip/.pyenv/versions/3.9.9/lib/python3.9/site-packages/pip/_vendor/pep517/in_process/_in_process.py build_wheel /var/folders/ff/3y2196b13bq0nbm3_ms25nyh0000gp/T/tmpm51b1yso
       cwd: /private/var/folders/ff/3y2196b13bq0nbm3_ms25nyh0000gp/T/pip-install-qm2a1dud/xmlsec_cd7a81ea26444cc4b8ae24acd3ec379d
  Complete output (65 lines):
  running bdist_wheel
  running build
  running build_py
  creating build
  creating build/lib.macosx-11.3-x86_64-cpython-39
  creating build/lib.macosx-11.3-x86_64-cpython-39/xmlsec
  copying src/xmlsec/py.typed -> build/lib.macosx-11.3-x86_64-cpython-39/xmlsec
  copying src/xmlsec/tree.pyi -> build/lib.macosx-11.3-x86_64-cpython-39/xmlsec
  copying src/xmlsec/__init__.pyi -> build/lib.macosx-11.3-x86_64-cpython-39/xmlsec
  copying src/xmlsec/constants.pyi -> build/lib.macosx-11.3-x86_64-cpython-39/xmlsec
  copying src/xmlsec/template.pyi -> build/lib.macosx-11.3-x86_64-cpython-39/xmlsec
  running build_ext
  building 'xmlsec' extension
  creating …
Run Code Online (Sandbox Code Playgroud)

python macos homebrew pip xmlsec

15
推荐指数
2
解决办法
8622
查看次数

为正值编写 dbt 测试

有没有一种简单的方法可以为 dbt 中呈阳性的列编写测试?

accepted_values似乎不适用于连续变量。

我知道您可以编写查询,./tests但对于如此简单的事情来说,这看起来有点过分了。

dbt

12
推荐指数
2
解决办法
7935
查看次数

返回 Spyder 中的上一行

我正在使用 Spyder 编辑器,我必须从我正在编写的代码片段到我正在调用的函数的定义来回切换。鉴于这个问题,我正在寻找移动的捷径。我知道如何转到函数定义(使用Ctrl + g),但我不知道如何返回到我正在编写的代码段。是否有捷径可寻?

python keyboard-shortcuts spyder

5
推荐指数
1
解决办法
3035
查看次数

有没有办法强制 SimpleImputer 返回 pandas 数据帧?

下面的代码

from sklearn.impute import SimpleImputer
import pandas as pd

df = pd.DataFrame(dict(
    x=[1, 2, np.nan],
    y=[2, np.nan, 0]
))

SimpleImputer().fit_transform(df)
Run Code Online (Sandbox Code Playgroud)

退货

array([[1. , 2. ],
       [2. , 1. ],
       [1.5, 0. ]])
Run Code Online (Sandbox Code Playgroud)

有没有办法使用返回 pandas 数据帧而不是 numpy 数组的输入器?有没有 scikit-learn 实现?

python numpy pandas scikit-learn

5
推荐指数
2
解决办法
4143
查看次数

^在诗中是什么意思?

我没有在文档中找到它,但我在诗歌中的 pyproject.toml 文件中看到如下内容:

psycopg2-binary="^2.9.1"
Run Code Online (Sandbox Code Playgroud)

^ 是什么意思?

谢谢!

python-poetry

5
推荐指数
1
解决办法
2237
查看次数

在 dbt 的 Jinja 宏中使用字符串作为参数

我想创建一个 dbt 宏来简化以下几行

COALESCE(LOWER(tags::TEXT) ~ '.*my-first-query.*', FALSE),
COALESCE(LOWER(tags::TEXT) ~ '.*my-second-query.*', FALSE),
COALESCE(LOWER(tags::TEXT) ~ '.*my-other-query.*', FALSE)
Run Code Online (Sandbox Code Playgroud)

我想将计算转换为函数,以便我可以将行转换为

 {{ extract_clean_tag(my-first-query) }},
 {{ extract_clean_tag(my-second-query) }},
 {{ extract_clean_tag(my-other-query) }}
Run Code Online (Sandbox Code Playgroud)

如何在 dbt 中编写此宏?我在将字符串作为参数传递给函数时遇到问题。

到目前为止,我已经尝试过类似的东西

{% macro extract_clean_tag(tag_regex) %}

    COALESCE(LOWER(tags::TEXT) ~ '.*{{ tag_regex }}.*', FALSE)

{% endmacro %}
Run Code Online (Sandbox Code Playgroud)

并通过调用它extract_clean_tag(my-first-query),但 dbt 返回:

column "my-first-query" does not exist
Run Code Online (Sandbox Code Playgroud)

jinja2 dbt

2
推荐指数
1
解决办法
2254
查看次数

运行dbt而不编译

是否可以dbt run使用已编译的代码执行 a 而无需再次运行编译?

我有一个需要大量编译时间且运行时间非常短的项目,我必须运行它 1000 次。

dbt

2
推荐指数
1
解决办法
2627
查看次数

Airflow 中是否有运算符可以根据 BigQuery 中的查询创建表?

我正在寻找类似的东西

CreateBQTableOperator(
    query='select * from my_table',
    output_table='my_other_table'
)
Run Code Online (Sandbox Code Playgroud)

我正在寻找现有的运算符或此类运算符的代码。操作员应该使用另一个参数来决定是否在重新创建表或将查询附加到当前表之前删除该表(如果该表存在)。

python google-bigquery airflow

2
推荐指数
1
解决办法
2209
查看次数

在 python slim buster 中安装 nodejs

我有一个以

FROM python:3.7-slim-buster
Run Code Online (Sandbox Code Playgroud)

我想安装node.jsnpm在里面。如何在此映像中安装它们?

python node.js docker dockerfile

1
推荐指数
1
解决办法
641
查看次数

在 Pandas 中按组过滤

我有以下数据框

 df = pd.DataFrame(dict(g = [0, 0, 1, 1, 2, 2], x = [0, 1, 1, 2, 2, 3]))
Run Code Online (Sandbox Code Playgroud)

我想从g这样的组中获取这个数据帧的一个子集mean(x) > 0.6。也就是说,我想要一个filter_group操作来获取以下数据帧:

>>> filtered_df = filter_group(df)
>>> filtered_df
   g  x
2  1  1
3  1  2
4  2  2
5  2  3

Run Code Online (Sandbox Code Playgroud)

有没有一种简单的方法可以在熊猫中做到这一点?这类似于havingSQL 中的操作,但有点不同,因为我想获取具有相同架构但行数较少的数据帧。


对于 R 用户,我想做的是:

library(dplyr)
df <- tibble(
  g = c(0, 0, 1, 1, 2, 2),
  x = c(0, 1, 1, 2, 2, 3)
)

df %>% 
  group_by(g) %>% …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

1
推荐指数
1
解决办法
45
查看次数