我不确定如何在搜索时正确说出这一点,很抱歉,如果这有一个简单的答案.
我有58个数据帧,每行约25,000行.csv's.他们看起来像这样:
Probe.Id Gene.Id Score.d
1418126_at 6352 28.52578
145119_a_at 2192 24.87866
1423477_at NA 24.43532
1434193_at 100506144///9204 6.22395
Run Code Online (Sandbox Code Playgroud)
理想情况下,我想在"///"处拆分ID并将它们放在新行上.像这样:
Probe.Id Gene.Id Score.d
1418126_at 6352 28.52578
145119_a_at 2192 24.87866
1423477_at NA 24.43532
1434193_at 100506144 6.22395
1434193_at 9204 6.22395
Run Code Online (Sandbox Code Playgroud)
使用strsplit允许我将Gene.Id作为一个字符向量列表,但是一旦我有了这个,我不知道最有效的方法是使用另一个正确的值来获取每个单独的id在他们自己的行上列.理想情况下,我不想只循环25,000行.
如果有人知道正确的方法,我会非常感激.
编辑:我应该补充说,有一个复杂的因素,有些行有像这样的ID:
333932///126961///653604///8350///8354///8355///8356///8968///8352///8358///835??1///8353///8357"
Run Code Online (Sandbox Code Playgroud)
我不知道连续的最大数量是多少.