小编Eli*_*ley的帖子

为组中第一次出现变量提取行

我有一个巨大的数据集（超过 200 万行，超过 100 个变量；下面是一个小样本）。对于每个subj_trial组，我想在 .wav 中找到包含在“.wav”中的每个唯一变量的第一次出现message。它应该只是包含，而不是结尾（即 *.wav），因为某些行在message字段中包含一堆信息（示例中未显示，抱歉）。

输出只有这三列的 data.frame 是可以的，但这不是必需的。稍后我将需要使用该timestamp列进行分析。

我发现了这个问题：为数据框中第一次出现变量提取行，但对于我的生活，我无法使用该示例来适合我的。

以下是一些示例数据：

   subj_trial     message timestamp
1         1_1 message 459    755616
2         1_1           .    755618
3         1_1   test1.wav    755662
4         1_1           .    765712
5         1_1   test1.wav    767918
6         1_2           .    769342
7         1_2   test2.wav    775662
8         1_2           .    786412
9         1_2   test2.wav    797460
10        1_2           .    807626
11        1_3   test3.wav    817794
12        1_3  warning 11    827960
13        2_1 message 481 …

Run Code Online (Sandbox Code Playgroud)

Eli*_*ley

2017 05-23

5
推荐指数

2
解决办法

4343
查看次数

标签统计

r ×1

为组中第一次出现变量提取行

标签 统计

小编Eli_ley的帖子

标签统计