小编Lau*_*ent的帖子

如何增加 Pandas 的行高？

关于如何更改 pandas 数据框中的列宽，有很好的答案，例如此处，但我找不到任何描述如何更改行高的内容？

我正在尝试并排查看两个长文本以进行比较，并且我想增加行高以使其更容易。也许与某些有关expand_frame_repr？

python nlp pandas

pie*_*per

2021 09-18

7
推荐指数

1
解决办法

815
查看次数

如何在包级别禁用 mypy 错误代码？

variable=[]

错误：

 error: Need type annotation for 'variable' (hint: "variable: List[<type>] = ...")

Run Code Online (Sandbox Code Playgroud)

在配置文件中：mypy.ini

disallow_any_expr=False

有没有办法通过配置文件中的标志来覆盖此错误？

python types type-hinting mypy

pan*_*esh

2021 06-13

6
推荐指数

1
解决办法

3586
查看次数

无法使用新观察值更新 StatsModels SARIMAX（ValueError）

我正在尝试使用 SciKitLearn 在时间序列数据集上运行样本外验证TimeSeriesSplit()来创建训练/测试折叠。

这个想法是在训练折叠上训练 Statsmodel 的 SARIMAX，然后在测试折叠上进行验证，而无需重新拟合模型。为此，我们必须在预测之前将测试折叠中的新观察结果一次一次地迭代附加到模型中。

但是，我在该附加步骤中收到 ValueError： ValueError: Given `endog` does not have an index that extends the index of the model.

这对我来说毫无意义。如果我打印print(max(train_fold.index), min(test_fold.index))每次折叠，显然序列折叠的最后一个索引低于测试折叠的第一个索引。就我而言：

1983-05 1983-06
1984-05 1984-06
1985-05 1985-06
1986-05 1986-06
1987-05 1987-06

Run Code Online (Sandbox Code Playgroud)

这是当前的完整代码。我确信我在做一些愚蠢的事情，但我被困住了：

1983-05 1983-06
1984-05 1984-06
1985-05 1985-06
1986-05 1986-06
1987-05 1987-06

Run Code Online (Sandbox Code Playgroud)

这model_fitted.append(next_row, refit=False)是故障点。有任何想法吗？谢谢！

python time-series pandas statsmodels arima

Jos*_*osh

2021 07-07

4
推荐指数

1
解决办法

1117
查看次数

如果“pandas.testing.assert_frame_equal”失败，如何输出所有差异？

我正在对数据框输出进行单元测试。我有两个数据框，在多列上具有不同的值

df1 = pd.DataFrame({"col1": [1, 1], "col2":[1, 1]})
df2 = pd.DataFrame({"col1": [1, 2], "col2":[1, 2]})

Run Code Online (Sandbox Code Playgroud)

当我运行时pandas.testing.assert_frame_equal，出现以下错误，只有一列：

DataFrame.iloc[:, 0] (column name="col1") values are different (50.0 %)
[index]: [0, 1]
[left]:  [1, 1]
[right]: [1, 2]

Run Code Online (Sandbox Code Playgroud)

但是，我没有关于第二列的信息。有没有办法显示所有不匹配，而不仅仅是最左侧列中的第一个不匹配？

python unit-testing pandas

led*_*uss

2022 03-13

4
推荐指数

1
解决办法

2355
查看次数

VS Code 中光标移动到结束引号后并在单引号后添加双引号

每当我键入双引号时，光标都会移到结束引号的右侧。这非常烦人。我的意思是，当我输入双引号时，光标会向右移动，即在结束引号之后，这是违反直觉的，因为我必须将光标向左移动到双引号内，以向右引号内的某些内容。

我也找不到合适的设置来控制这种行为。是否有设置可以控制输入引号时的光标行为？

我必须按double ""才能添加引号。有没有设置可以将其更改为单击添加字符？

visual-studio-code text-cursor

Abd*_*ees

2022 01-01

2
推荐指数

1
解决办法

1037
查看次数

如何更新 Polars 数据框中的单个值？

在 Pandas 中，您可以使用at属性更新值，如下所示：

import pandas as pd

df = pd.DataFrame({"col1": [1, 2, 3], "col2": [4, 5, 6]})
df.at[2, "col2"] = 99

print(df)
# Output

   col1  col2
0     1     4
1     2     5
2     3    99

Run Code Online (Sandbox Code Playgroud)

在 Polars 中执行此操作的惯用方法是什么？

setvalue dataframe pandas python-polars

Lau*_*ent

lucky-day

2
推荐指数

1
解决办法

723
查看次数

如何对 Polar 数据框中的持续时间求和？

我有以下数据框：

import datetime\n\nimport polars as pl\n\n\ndf = pl.DataFrame(\n    {\n        "idx": [259, 123],\n        "timestamp": [\n            [\n                datetime.datetime(2023, 4, 20, 1, 45),\n                datetime.datetime(2023, 4, 20, 1, 51, 7),\n                datetime.datetime(2023, 4, 20, 2, 29, 50),\n            ],\n            [\n                datetime.datetime(2023, 4, 19, 6, 0, 1),\n                datetime.datetime(2023, 4, 19, 6, 0, 17),\n                datetime.datetime(2023, 4, 19, 6, 0, 26),\n                datetime.datetime(2023, 4, 19, 19, 53, 29),\n                datetime.datetime(2023, 4, 19, 19, 54, 4),\n                datetime.datetime(2023, 4, 19, 19, 57, 52),\n            ],\n        ],\n    }\n)\n

Run Code Online (Sandbox Code Playgroud)\n

print(df)\n# Output\nshape: (2, 2)\n\xe2\x94\x8c\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xac\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x90\n\xe2\x94\x82 idx …

Run Code Online (Sandbox Code Playgroud)

python duration dataframe python-polars

Lau*_*ent

2023 04-23

1
推荐指数

1
解决办法

177
查看次数