相关疑难解决方法(0)

从Python中的字符串中删除除字母数字字符之外的所有内容

使用Python从字符串中删除所有非字母数字字符的最佳方法是什么?

这个问题PHP变体中提出的解决方案可能会进行一些微小的调整,但对我来说似乎不太"pythonic".

为了记录,我不仅要删除句点和逗号(以及其他标点符号),还要删除引号,括号等.

python string

295
推荐指数
11
解决办法
28万
查看次数

从列中的字符串中删除不需要的部分

我正在寻找一种有效的方法来从DataFrame列中的字符串中删除不需要的部分.

数据看起来像:

    time    result
1    09:00   +52A
2    10:00   +62B
3    11:00   +44a
4    12:00   +30b
5    13:00   -110a
Run Code Online (Sandbox Code Playgroud)

我需要将这些数据修剪为:

    time    result
1    09:00   52
2    10:00   62
3    11:00   44
4    12:00   30
5    13:00   110
Run Code Online (Sandbox Code Playgroud)

我试过了.str.lstrip('+-').str.rstrip('aAbBcC'),但得到一个错误:

TypeError: wrapper() takes exactly 1 argument (2 given)
Run Code Online (Sandbox Code Playgroud)

任何指针将不胜感激!

python string dataframe pandas

100
推荐指数
8
解决办法
20万
查看次数

使用pandas快速删除标点符号

这是一个自我回答的帖子.下面我概述NLP域中的一个常见问题,并提出一些高效的方法来解决它.

通常需要在文本清理和预处理期间去除标点符号.标点符号定义为以下任何字符string.punctuation:

>>> import string
string.punctuation
'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
Run Code Online (Sandbox Code Playgroud)

这是一个很常见的问题,并且在恶心之前就被问过了.最惯用的解决方案是使用熊猫str.replace.但是,对于涉及大量文本的情况,可能需要考虑更高性能的解决方案.

str.replace在处理数十万条记录时,有哪些优秀,高效的替代方案?

python regex string numpy pandas

48
推荐指数
3
解决办法
5392
查看次数

标签 统计

python ×3

string ×3

pandas ×2

dataframe ×1

numpy ×1

regex ×1