我有一个如下所示的数据框:
A B C
1 red78 square big235
2 green circle small123
3 blue45 triangle big657
Run Code Online (Sandbox Code Playgroud)
我需要能够从列C中的所有行中删除非数字字符,以便我的数据框看起来像:
A B C
1 red78 square 235
2 green circle 123
3 blue45 triangle 657
Run Code Online (Sandbox Code Playgroud)
我尝试使用以下,但得到错误预期的字符串或缓冲区:
import re
dfOutput.imgID = dfOutput.imgID.apply(re.sub('[^0-9]','', dfOutput.imgID), axis = 0)
Run Code Online (Sandbox Code Playgroud)
我该怎么做呢?
用于创建数据帧的代码:
dfObject = pd.DataFrame()
dfObject.set_value(1, 'A', 'red78')
dfObject.set_value(1, 'B', 'square')
dfObject.set_value(1, 'C', 'big235')
dfObject.set_value(2, 'A', 'green')
dfObject.set_value(2, 'B', 'circle')
dfObject.set_value(2, 'C', 'small123')
dfObject.set_value(3, 'A', 'blue45')
dfObject.set_value(3, 'B', 'triangle')
dfObject.set_value(3, 'C', 'big657')
Run Code Online (Sandbox Code Playgroud) 我在 R 中有一个字符向量元素,类似于:
[1] Deer giraffe hippopotamus lion
Run Code Online (Sandbox Code Playgroud)
和一个字符串,例如
a <- "ogiraffeps"
Run Code Online (Sandbox Code Playgroud)
如何找到字符向量中包含字符串中模式的元素的索引?我希望能够在不循环字符向量的情况下执行此操作
我是 R 新手,但grep似乎无法处理这个问题,因为它总是使用单个字符串(模式)来查看它是否包含在字符向量中。但是,我想要做的是找到字符串中包含的字符向量的元素。
我有一个看起来像这样的字符向量
Categories = sample(make.unique(rep(letters, length.out = 5), sep=''))
Categories
[1] "d-" "e-" "c-" "a-" "b-"
Run Code Online (Sandbox Code Playgroud)
我有一个数据帧df,看起来像:
df = data.frame(name = c(1:10), cat = paste(c(letters[1:10]), "-1", sep = ""))
df
name cat
1 1 a-1
2 2 b-1
3 3 c-1
4 4 d-1
5 5 e-1
6 6 f-1
7 7 g-1
8 8 h-1
9 9 i-1
10 10 j-1
Run Code Online (Sandbox Code Playgroud)
我希望按照df中"cat"列中包含的Categories元素的顺序获取df中的行号.所以,我想得到
dfRowNumbers
[1] 4,5,3,1,2
Run Code Online (Sandbox Code Playgroud)
我怎么能得到它?
我有一个看起来像这样的数据框:
My_Data = data.frame(name = rep(LETTERS[1:10],3), number = sample(0:3,30, replace=TRUE)
name number
1 A 3
2 B 3
3 C 0
4 D 3
5 E 2
6 F 2
7 G 2
8 H 2
9 I 1
10 J 3
11 A 1
12 B 2
13 C 0
14 D 1
15 E 3
16 F 0
17 G 2
18 H 2
19 I 2
20 J 2
21 A 0
22 B 1
23 C …Run Code Online (Sandbox Code Playgroud)