小编Ale*_*erg的帖子

具有阈值的累积销售数据形成具有布尔值的新系列/列?

我有这种类型的数据,但在现实生活中它有数百万个条目。产品 ID 始终是特定于产品的,但在其生命周期中会出现多次。

日期 产品编号 收入 估计终生价值
2021-04-16 0061M00001AXc5lQAD 970 2000年
2021-04-17 0061M00001AXbCiQAL 159 50000
2021-04-18 0061M00001AXb9AQAT 80 3000
2021-04-19 0061M00001AXbIHQA1 1100 8000
2021-04-20 0061M00001AXbY8QAL 90 4000
2021-04-21 0061M00001AXbQ1QAL 29 30000
2021-04-21 0061M00001AXc5lQAD 30 2000年
2021-05-02 0061M00001AXc5lQAD 50 2000年
2021-05-05 0061M00001AXc5lQAD 50 2000年

我希望在 Pandas 中创建一个新列,指示某个产品 ID 何时产生的收入超过特定阈值,例如 100 美元、1000 美元,将其标记为胜利 (1)。在产品的生命周期中,胜利可能只发生一次。此外,我想创建另一列,指示特定产品销售额超过估计生命周期价值的 10% 的行。

在 Python / Pandas 中实现这一目标的最直观方法是什么?

编辑:

  • dw1k_thresh:如果特定产品 id 的累计销售额 >= 1000,则该列采用布尔值 1,否则为零。但是 1 只能出现一次,之后再次始终为零。基本上它只是一个产品销量超过1000临界值时的日期和交易指标。

  • dw10perc:如果一个产品 id 的累计销售额 >= 估计生命周期价值的 10%,则该列取值为 1,否则为 0。但是 1 只能出现一次,之后再次始终为零。基本上它只是一个日期和交易的指标,当产品销售额超过估计生命周期价值的 10% 的临界值时。 …

python python-3.x pandas

5
推荐指数
1
解决办法
162
查看次数

Pandas Styler.to_latex() - 如何传递命令并进行简单编辑

如何将以下命令传递到 Latex 环境中?

\centering(我需要横向表格居中)

\caption*(我需要跳过面板的表格编号)

此外,我需要在 t 统计量中添加括号星号,这意味着数据帧上的特定于行的格式。

例如:

当前的

多变的 价值
常量 2.439628
统计时间 13.921319
家族企业 0.114914
统计时间 0.351283
创始人 0.154914
统计时间 2.351283
调整后的 R 方 0.291328

我要这个

多变的 价值
常量 2.439628
统计时间 (13.921319)***
家族企业 0.114914
统计时间 (0.351283)
创始人 0.154914
统计时间 (1.651283)**
调整后的 R 方 0.291328

我正在 DataSpell 上写研究论文。所有实证工作都在 Python 中进行,然后我使用 Latex (TexiFy) 在 DataSpell 中创建 pdf。由于这个工作流程,我无法在乳胶代码中编辑表格,因为每次运行 jupyter 笔记本时它们都会被覆盖。

如果有帮助的话,下面是我如何将表传递到乳胶环境的示例:

# drop index to column
panel_a.reset_index(inplace=True)


# write Latex index and cut names …
Run Code Online (Sandbox Code Playgroud)

python latex pandas pandas-styles

0
推荐指数
1
解决办法
945
查看次数

标签 统计

pandas ×2

python ×2

latex ×1

pandas-styles ×1

python-3.x ×1