我是python的新手并且练习书中的例子.
任何人都可以解释为什么当我试图用这个代码阻止一些例子什么都没有改变?
>>> from nltk.stem import PorterStemmer
>>> stemmer=PorterStemmer()
>>> stemmer.stem('numpang wifi stop gadget shopping')
'numpang wifi stop gadget shopping'
Run Code Online (Sandbox Code Playgroud)
但是,当我这样做时,它有效
>>> stemmer.stem('shopping')
'shop'
Run Code Online (Sandbox Code Playgroud) 我是python新手,需要帮助!我正在练习python NLTK文本分类.以下是我在http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/上练习的代码示例
我试过这个
from nltk import bigrams
from nltk.probability import ELEProbDist, FreqDist
from nltk import NaiveBayesClassifier
from collections import defaultdict
train_samples = {}
with file ('positive.txt', 'rt') as f:
for line in f.readlines():
train_samples[line]='pos'
with file ('negative.txt', 'rt') as d:
for line in d.readlines():
train_samples[line]='neg'
f=open("test.txt", "r")
test_samples=f.readlines()
def bigramReturner(text):
tweetString = text.lower()
bigramFeatureVector = {}
for item in bigrams(tweetString.split()):
bigramFeatureVector.append(' '.join(item))
return bigramFeatureVector
def get_labeled_features(samples):
word_freqs = {}
for text, label in train_samples.items():
tokens = text.split()
for …Run Code Online (Sandbox Code Playgroud) 这听起来可能很愚蠢,但是你知道如何构建文本语料库吗?我到处找了,已经有语料库了,但我想知道他们是如何建立的?例如,如果我想构建包含正面和负面推文的语料库,那么我只需制作两个文件?但是这些文件的内部呢?不明白(((( 在这个例子中,他将 pos 和 neg 推文存储在 RedisDB 中。