小编Aik*_*kin的帖子

PorterStemmer似乎不起作用

我是python的新手并且练习书中的例子.
任何人都可以解释为什么当我试图用这个代码阻止一些例子什么都没有改变?

>>> from nltk.stem import PorterStemmer
>>> stemmer=PorterStemmer()
>>> stemmer.stem('numpang wifi stop gadget shopping')
'numpang wifi stop gadget shopping'
Run Code Online (Sandbox Code Playgroud)

但是,当我这样做时,它有效

>>> stemmer.stem('shopping')
'shop'
Run Code Online (Sandbox Code Playgroud)

python porter-stemmer nltk

9
推荐指数
1
解决办法
1万
查看次数

n-gram与朴素贝叶斯分类器

我是python新手,需要帮助!我正在练习python NLTK文本分类.以下是我在http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/上练习的代码示例

我试过这个

from nltk import bigrams
from nltk.probability import ELEProbDist, FreqDist
from nltk import NaiveBayesClassifier
from collections import defaultdict

train_samples = {}

with file ('positive.txt', 'rt') as f:
   for line in f.readlines():
       train_samples[line]='pos'

with file ('negative.txt', 'rt') as d:
   for line in d.readlines():
       train_samples[line]='neg'

f=open("test.txt", "r")
test_samples=f.readlines()

def bigramReturner(text):
    tweetString = text.lower()
    bigramFeatureVector = {}
    for item in bigrams(tweetString.split()):
        bigramFeatureVector.append(' '.join(item))
    return bigramFeatureVector

def get_labeled_features(samples):
    word_freqs = {}
    for text, label in train_samples.items():
        tokens = text.split()
        for …
Run Code Online (Sandbox Code Playgroud)

python nltk n-gram

8
推荐指数
1
解决办法
1万
查看次数

构建您自己的文本语料库

这听起来可能很愚蠢,但是你知道如何构建文本语料库吗?我到处找了,已经有语料库了,但我想知道他们是如何建立的?例如,如果我想构建包含正面和负面推文的语料库,那么我只需制作两个文件?但是这些文件的内部呢?不明白(((( 在这个例子中,他将 pos 和 neg 推文存储在 RedisDB 中。

text corpus

3
推荐指数
1
解决办法
2606
查看次数

标签 统计

nltk ×2

python ×2

corpus ×1

n-gram ×1

porter-stemmer ×1

text ×1