我有这种类型的数据,但在现实生活中它有数百万个条目。产品 ID 始终是特定于产品的,但在其生命周期中会出现多次。
| 日期 | 产品编号 | 收入 | 估计终生价值 |
|---|---|---|---|
| 2021-04-16 | 0061M00001AXc5lQAD | 970 | 2000年 |
| 2021-04-17 | 0061M00001AXbCiQAL | 159 | 50000 |
| 2021-04-18 | 0061M00001AXb9AQAT | 80 | 3000 |
| 2021-04-19 | 0061M00001AXbIHQA1 | 1100 | 8000 |
| 2021-04-20 | 0061M00001AXbY8QAL | 90 | 4000 |
| 2021-04-21 | 0061M00001AXbQ1QAL | 29 | 30000 |
| 2021-04-21 | 0061M00001AXc5lQAD | 30 | 2000年 |
| 2021-05-02 | 0061M00001AXc5lQAD | 50 | 2000年 |
| 2021-05-05 | 0061M00001AXc5lQAD | 50 | 2000年 |
我希望在 Pandas 中创建一个新列,指示某个产品 ID 何时产生的收入超过特定阈值,例如 100 美元、1000 美元,将其标记为胜利 (1)。在产品的生命周期中,胜利可能只发生一次。此外,我想创建另一列,指示特定产品销售额超过估计生命周期价值的 10% 的行。
在 Python / Pandas 中实现这一目标的最直观方法是什么?
编辑:
dw1k_thresh:如果特定产品 id 的累计销售额 >= 1000,则该列采用布尔值 1,否则为零。但是 1 只能出现一次,之后再次始终为零。基本上它只是一个产品销量超过1000临界值时的日期和交易指标。
dw10perc:如果一个产品 id 的累计销售额 >= 估计生命周期价值的 10%,则该列取值为 1,否则为 0。但是 1 只能出现一次,之后再次始终为零。基本上它只是一个日期和交易的指标,当产品销售额超过估计生命周期价值的 10% 的临界值时。 …
如何将以下命令传递到 Latex 环境中?
\centering(我需要横向表格居中)
和
\caption*(我需要跳过面板的表格编号)
此外,我需要在 t 统计量中添加括号和星号,这意味着数据帧上的特定于行的格式。
例如:
当前的
| 多变的 | 价值 |
|---|---|
| 常量 | 2.439628 |
| 统计时间 | 13.921319 |
| 家族企业 | 0.114914 |
| 统计时间 | 0.351283 |
| 创始人 | 0.154914 |
| 统计时间 | 2.351283 |
| 调整后的 R 方 | 0.291328 |
我要这个
| 多变的 | 价值 |
|---|---|
| 常量 | 2.439628 |
| 统计时间 | (13.921319)*** |
| 家族企业 | 0.114914 |
| 统计时间 | (0.351283) |
| 创始人 | 0.154914 |
| 统计时间 | (1.651283)** |
| 调整后的 R 方 | 0.291328 |
我正在 DataSpell 上写研究论文。所有实证工作都在 Python 中进行,然后我使用 Latex (TexiFy) 在 DataSpell 中创建 pdf。由于这个工作流程,我无法在乳胶代码中编辑表格,因为每次运行 jupyter 笔记本时它们都会被覆盖。
如果有帮助的话,下面是我如何将表传递到乳胶环境的示例:
# drop index to column
panel_a.reset_index(inplace=True)
# write Latex index and cut names …Run Code Online (Sandbox Code Playgroud)