小编TJE*_*TJE的帖子

在 Pandas 数据框中，如何提取同一列中不同行上的值之间的差异，以第二列为条件？

这是一个更大项目的一部分，但我已将问题分解为多个步骤，所以这是第一步。采用 Pandas 数据框，如下所示：

index | user   time     
---------------------
 0      F       0   
 1      T       0   
 2      T       0   
 3      T       1   
 4      B       1 
 5      K       2 
 6      J       2 
 7      T       3 
 8      J       4 
 9      B       4

Run Code Online (Sandbox Code Playgroud)

对于每个唯一用户，我可以在某些条件下提取“时间”列中的值之间的差异吗？

例如，用户 J 有两个实例，这两个实例之间的“时间”差异是 2。我可以提取这两行之间的差异 2 吗？然后，如果该用户再次出现，请提取该行与数据框中该用户之前出现之间的差异？

python slice pandas

TJE*_*TJE

lucky-day

1
推荐指数

1
解决办法

248
查看次数

如何管理读取csv的问题,这是一个以分号分隔的文件,其中一些字符串包含分号？

我可以通过在我的csv(以分号分隔)文件中显示几个示例行来说明我遇到的问题,如下所示:

4;1;"COFFEE; COMPANY";4
3;2;SALVATION ARMY;4

Run Code Online (Sandbox Code Playgroud)

请注意,在一行中,一个字符串在引号中并且在其中有一个分号(除了包含分号的列之外,没有列在我的输入文件中有引号).

带引号和分号的这些行导致了问题 - 基本上,我的代码在列/字段内的引号内计算分号.因此,当我在这一行中读取时,它会在字符串中读取这个分号作为分隔符,从而使得该行看起来像是一个额外的字段/列.

所需的输出看起来像这样,"咖啡公司"周围没有引号,"咖啡"和"公司"之间没有分号:

4;1;COFFEE COMPANY;4
3;2;SALVATION ARMY;4

Run Code Online (Sandbox Code Playgroud)

实际上,这个带有"咖啡公司"的专栏对我来说完全没用,所以最终文件也可能是这样的:

4;1;xxxxxxxxxxx;4
3;2;xxxxxxxxxxx;4

Run Code Online (Sandbox Code Playgroud)

我怎样才能摆脱这个特定列中的半冒号,但是没有摆脱所有其他的冒号？

python csv string

TJE*_*TJE

2019 03-24

1
推荐指数

1
解决办法

542
查看次数

标签统计

python ×2

csv ×1

pandas ×1

slice ×1

string ×1

在 Pandas 数据框中，如何提取同一列中不同行上的值之间的差异，以第二列为条件？

如何管理读取csv的问题,这是一个以分号分隔的文件,其中一些字符串包含分号？

标签 统计

小编TJE_TJE的帖子

标签统计