我已经将一些定价数据读入了pandas数据框,其值显示为:
$40,000*
$40000 conditions attached
Run Code Online (Sandbox Code Playgroud)
我想将其剥离为数值.我知道我可以循环并应用正则表达式
[0-9]+
Run Code Online (Sandbox Code Playgroud)
到每个字段然后将结果列表重新加入,但是有一种不循环的方式吗?
谢谢
尝试使用一列中的值(作为字符串)来确定从另一列中删除的内容。列的其余部分必须保持不变。
示例数据:
import pandas as pd
dfTest = pd.DataFrame({
'date': ['190225', '190225', '190226'],
'foo': ['190225-file1_190225', '190225-file2_190225', '190226-file3_190226']
})
dfTest
Run Code Online (Sandbox Code Playgroud)
结果数据框:
| date | foo
------------------------------------
0 | 190225 | 190225-file1_190225
1 | 190225 | 190225-file2_190225
2 | 190226 | 190226-file3_190226
Run Code Online (Sandbox Code Playgroud)
我需要创建 'bar' 列,其中 'foo' 已删除所有 'date' 匹配项。
我要找的是这个:
| date | foo | bar
-----------------------------------------------
0 | 190225 | 190225-file1_190225 | -file1_
1 | 190225 | 190225-file2_190225 | -file2_
2 | 190226 | 190226-file3_190226 | -file3_
Run Code Online (Sandbox Code Playgroud)
'date' 列的内容,无论它们出现在开头、中间还是结尾,都需要为 'foo.' 的每一行删除。 …