我有这种格式的数据:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 1 <--
A 200 1 <--
A 200 2
B 300 1
B 300 1 <--
Run Code Online (Sandbox Code Playgroud)
我需要删除每个 Session_ID 中步骤名称的重复值。例如ID = 200,有3个'1'需要改为1个'1',所以最终数据如下:
Category Session_ID Step_Name
A 100 1
A 100 2
A 200 1
A 200 2
B 300 1
Run Code Online (Sandbox Code Playgroud) 我在 Azure 监视器日志中有以下格式的点击流数据:
Category StepName Count_ Median_Duration(secs)
A step1 1200 00:00
A step2 1000 24:00
A step3 800 19:00
B step1 4000 00:00
B step2 3800 37:00
Run Code Online (Sandbox Code Playgroud)
我需要旋转表格才能得到这个:
Category Step1_Count Step1_Duration Step2_Count Step2_Duration Step3_Count ...
A 1200 00:00 1000 24:00 800 ...
B 4000 00:00 3800 37:00 0 ...
Run Code Online (Sandbox Code Playgroud)
现在,我只能使用评估枢轴(StepName,sum(Count_))或评估枢轴(StepName,sum(Median_Duration))聚合一列。是否可以在不使用连接的情况下获得上述格式?
注意:与输出表类似的格式就可以了,只需要计数和持续时间的聚合。