小编AAl*_*tch的帖子

将字符向量拆分为数据框中的新行的最快方法

我不确定如何在搜索时正确说出这一点,很抱歉,如果这有一个简单的答案.

我有58个数据帧,每行约25,000行.csv's.他们看起来像这样:

Probe.Id     Gene.Id             Score.d
1418126_at   6352                28.52578
145119_a_at  2192                24.87866
1423477_at   NA                  24.43532
1434193_at   100506144///9204    6.22395
Run Code Online (Sandbox Code Playgroud)

理想情况下,我想在"///"处拆分ID并将它们放在新行上.像这样:

Probe.Id     Gene.Id             Score.d
1418126_at   6352                28.52578
145119_a_at  2192                24.87866
1423477_at   NA                  24.43532
1434193_at   100506144           6.22395
1434193_at   9204                6.22395
Run Code Online (Sandbox Code Playgroud)

使用strsplit允许我将Gene.Id作为一个字符向量列表,但是一旦我有了这个,我不知道最有效的方法是使用另一个正确的值来获取每个单独的id在他们自己的行上列.理想情况下,我不想只循环25,000行.

如果有人知道正确的方法,我会非常感激.

编辑:我应该补充说,有一个复杂的因素,有些行有像这样的ID:

333932///126961///653604///8350///8354///8355///8356///8968///8352///8358///835??1///8353///8357" 
Run Code Online (Sandbox Code Playgroud)

我不知道连续的最大数量是多少.

split r

5
推荐指数
1
解决办法
1656
查看次数

标签 统计

r ×1

split ×1