我有一个数字列,可以包含不同形式[0-9]的其他字符.说:x = pandas.Series(["1","1.2", "*", "1", "**."])
.然后我想使用将该系列转换为数字列x.astype(dtype = float, errors = 'ignore')
.我无法弄清楚为什么熊猫不断给我一个错误,尽管我不让他这样做!我的代码有问题吗?
我正在处理一些 nlp 任务。我的输入是法语文本,因此在我的上下文中只有 Snowball Stemmer 可用。但不幸的是,它不断给我可怜的茎,因为它甚至不会删除plural "s"
或silent e
。下面是一些例子:
from nltk.stem import SnowballStemmer
SnowballStemmer("french").stem("pommes, noisettes dorées & moelleuses, la boîte de 350g")
Output: 'pommes, noisettes dorées & moelleuses, la boîte de 350g'
Run Code Online (Sandbox Code Playgroud)