小编ag1*_*g14的帖子

如何从pandas dataframe中特定列的所有值中删除所有非数字字符?

我有一个如下所示的数据框:

     A       B           C
1   red78   square    big235
2   green   circle    small123
3   blue45  triangle  big657
Run Code Online (Sandbox Code Playgroud)

我需要能够从列C中的所有行中删除非数字字符,以便我的数据框看起来像:

     A       B           C
1   red78   square    235
2   green   circle    123
3   blue45  triangle  657
Run Code Online (Sandbox Code Playgroud)

我尝试使用以下,但得到错误预期的字符串或缓冲区:

import re
dfOutput.imgID = dfOutput.imgID.apply(re.sub('[^0-9]','', dfOutput.imgID), axis = 0)
Run Code Online (Sandbox Code Playgroud)

我该怎么做呢?

用于创建数据帧的代码:

dfObject = pd.DataFrame()
dfObject.set_value(1, 'A', 'red78')
dfObject.set_value(1, 'B', 'square')
dfObject.set_value(1, 'C', 'big235')
dfObject.set_value(2, 'A', 'green')
dfObject.set_value(2, 'B', 'circle')
dfObject.set_value(2, 'C', 'small123')
dfObject.set_value(3, 'A', 'blue45')
dfObject.set_value(3, 'B', 'triangle')
dfObject.set_value(3, 'C', 'big657')
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

13
推荐指数
4
解决办法
1万
查看次数

在 R 中,如何搜索特定字符串中包含的字符向量元素?

我在 R 中有一个字符向量元素,类似于:

[1] Deer  giraffe  hippopotamus lion       
Run Code Online (Sandbox Code Playgroud)

和一个字符串,例如

a <- "ogiraffeps"
Run Code Online (Sandbox Code Playgroud)

如何找到字符向量中包含字符串中模式的元素的索引?我希望能够在不循环字符向量的情况下执行此操作

我是 R 新手,但grep似乎无法处理这个问题,因为它总是使用单个字符串(模式)来查看它是否包含在字符向量中。但是,我想要做的是找到字符串中包含的字符向量的元素。

string r vector string-matching

3
推荐指数
1
解决办法
1万
查看次数

我想获取数据框中所有行的行号,其中列中的元素包含向量中的元素

我有一个看起来像这样的字符向量

Categories = sample(make.unique(rep(letters, length.out = 5), sep=''))
Categories
[1] "d-" "e-" "c-" "a-" "b-"
Run Code Online (Sandbox Code Playgroud)

我有一个数据帧df,看起来像:

df = data.frame(name = c(1:10), cat = paste(c(letters[1:10]), "-1", sep = ""))
df
    name cat
1     1   a-1
2     2   b-1
3     3   c-1
4     4   d-1
5     5   e-1
6     6   f-1
7     7   g-1
8     8   h-1
9     9   i-1
10   10   j-1
Run Code Online (Sandbox Code Playgroud)

我希望按照df中"cat"列中包含的Categories元素的顺序获取df中的行号.所以,我想得到

dfRowNumbers
[1] 4,5,3,1,2
Run Code Online (Sandbox Code Playgroud)

我怎么能得到它?

r dataframe

2
推荐指数
1
解决办法
45
查看次数

如何计算具有不同因子值(另一列)的行的不同整数值(在特定列中)的出现?

我有一个看起来像这样的数据框:

My_Data = data.frame(name = rep(LETTERS[1:10],3), number = sample(0:3,30, replace=TRUE)

    name number
1     A      3
2     B      3
3     C      0
4     D      3
5     E      2
6     F      2
7     G      2
8     H      2
9     I      1
10    J      3
11    A      1
12    B      2
13    C      0
14    D      1
15    E      3
16    F      0
17    G      2
18    H      2
19    I      2
20    J      2
21    A      0
22    B      1
23    C …
Run Code Online (Sandbox Code Playgroud)

r dataframe

0
推荐指数
2
解决办法
68
查看次数

标签 统计

dataframe ×3

r ×3

pandas ×1

python ×1

string ×1

string-matching ×1

vector ×1