相关疑难解决方法(0)

转置/解压缩功能(zip的反转)?

我有一个2项元组的列表,我想将它们转换为2个列表,其中第一个包含每个元组中的第一个项目,第二个列表包含第二个项目.

例如:

original = [('a', 1), ('b', 2), ('c', 3), ('d', 4)]
# and I want to become...
result = (['a', 'b', 'c', 'd'], [1, 2, 3, 4])
Run Code Online (Sandbox Code Playgroud)

是否有内置函数可以做到这一点?

python transpose list matrix

480
推荐指数
6
解决办法
15万
查看次数

Python的集合之间的区别.Counter和nltk.probability.FreqDist

我想计算文本语料库中单词的术语 - 频率.我一直在使用NLTK的word_tokenize,然后是probability.FreqDist一段时间才能完成.word_tokenize返回一个列表,该列表由FreqDist转换为频率分布.但是,我最近在集合(collections.Counter)中遇到了Counter函数,它似乎做了完全相同的事情.FreqDist和Counter都有一个most_common(n)函数,它返回n个最常用的单词.有谁知道这两者之间是否存在差异?一个比另一个快吗?是否存在可以工作而另一个不工作的情况?

python nlp nltk

5
推荐指数
1
解决办法
1844
查看次数

使用 nltk 绘制 50 个最不常见的单词

如何绘制 50 个最不常见的单词?

也许是我想得太复杂了。这是我得到这些词的方式:

distr = nltk.FreqDist(word for word in items)
words = distr .keys()
seldomwords = words [:50]
Run Code Online (Sandbox Code Playgroud)

我现在该如何绘制这个?

通过plot函数,FreqDist我得到所有或仅x个最常见的单词。

我尝试过类似的东西:

distr .plot(:50)
Run Code Online (Sandbox Code Playgroud)

但这在语法上是不正确的。

python plot nlp nltk

2
推荐指数
1
解决办法
6581
查看次数

标签 统计

python ×3

nlp ×2

nltk ×2

list ×1

matrix ×1

plot ×1

transpose ×1