考虑
doc = ["i am a fellow student", "we both are the good student", "a student works hard"]
Run Code Online (Sandbox Code Playgroud)
我有这个作为输入我只想打印整个列表中每个单词出现的次数:
例如 student 出现 3 次所以 预期输出student=3, a=2, etc
我能够打印文档中的唯一单词,但无法打印出现的次数。这是我使用的功能:
def fit(doc):
unique_words = set()
if isinstance(dataset, (list,)):
for row in dataset:
for word in row.split(" "):
if len(word) < 2:
continue
unique_words.add(word)
unique_words = sorted(list(unique_words))
return (unique_words)
doc=fit(docs)
print(doc)
['am', 'are', 'both', 'fellow', 'good', 'hard', 'student', 'the', 'we', 'works']
Run Code Online (Sandbox Code Playgroud)
我得到这个作为输出我只想要unique_words的出现次数。请问我该怎么做?