小编Emr*_*eYe的帖子

类型错误：lemmatize() 缺少 1 个必需的位置参数：'word

我在 csv 文件中的每一行都有一个数组，如下所示：

\n\n

[['thxx'], ['too', 'late', 'now', 'dumbass'], ['you', '\xe2\x80\x98', 're', 'so', 'dumb', '?', '?'], ['thxxx'], ['i', '\xe2\x80\x98', 'd', 'be', 'fucked']]\n

Run Code Online (Sandbox Code Playgroud)\n\n

当我尝试将其传递给词形还原器时，如下所示：

\n\n

from nltk.stem import WordNetLemmatizer\nlemmatized_words = [WordNetLemmatizer.lemmatize(word) for word in tokened_text]\nprint(lemmatized_words)\n

Run Code Online (Sandbox Code Playgroud)\n\n

我收到以下错误：

\n\n

TypeError: lemmatize() missing 1 required positional argument: 'word'\n

Run Code Online (Sandbox Code Playgroud)\n\n

这是为什么？

\n\n

作为一个附带问题：在将其传递给矢量化之前，我需要执行此操作吗？我正在构建一个机器学习模型，并在 sci kit learn 中看到了 CountVectorizer 函数，但找不到任何它预先进行词形还原等的信息。

nlp machine-learning nltk

Emr*_*eYe

2020 04-11

1
推荐指数

1
解决办法

6488
查看次数

标签统计

machine-learning ×1

nlp ×1

nltk ×1

类型错误：lemmatize() 缺少 1 个必需的位置参数：'word

标签 统计

小编Emr_eYe的帖子

标签统计