小编Aik*_*kin的帖子

PorterStemmer似乎不起作用

我是python的新手并且练习书中的例子.
任何人都可以解释为什么当我试图用这个代码阻止一些例子什么都没有改变？

>>> from nltk.stem import PorterStemmer
>>> stemmer=PorterStemmer()
>>> stemmer.stem('numpang wifi stop gadget shopping')
'numpang wifi stop gadget shopping'

Run Code Online (Sandbox Code Playgroud)

但是,当我这样做时,它有效

>>> stemmer.stem('shopping')
'shop'

Run Code Online (Sandbox Code Playgroud)

python porter-stemmer nltk

Aik*_*kin

2013 12-31

9
推荐指数

1
解决办法

1万
查看次数

n-gram与朴素贝叶斯分类器

我是python新手,需要帮助!我正在练习python NLTK文本分类.以下是我在http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/上练习的代码示例

我试过这个

from nltk import bigrams
from nltk.probability import ELEProbDist, FreqDist
from nltk import NaiveBayesClassifier
from collections import defaultdict

train_samples = {}

with file ('positive.txt', 'rt') as f:
   for line in f.readlines():
       train_samples[line]='pos'

with file ('negative.txt', 'rt') as d:
   for line in d.readlines():
       train_samples[line]='neg'

f=open("test.txt", "r")
test_samples=f.readlines()

def bigramReturner(text):
    tweetString = text.lower()
    bigramFeatureVector = {}
    for item in bigrams(tweetString.split()):
        bigramFeatureVector.append(' '.join(item))
    return bigramFeatureVector

def get_labeled_features(samples):
    word_freqs = {}
    for text, label in train_samples.items():
        tokens = text.split()
        for …

Run Code Online (Sandbox Code Playgroud)

python nltk n-gram

Aik*_*kin

2013 01-14

8
推荐指数

1
解决办法

1万
查看次数