我没有正式的自然语言处理背景,想知道NLP方面的人是否可以对此有所了解.我正在玩NLTK库,我特意调查了这个包提供的停用词功能:
在[80]中:nltk.corpus.stopwords.words('english')
出[80]:
['我','我','我','我自己','我们','我们','我们','我们','你','你','你','你自己','你自己,'他','他','他','他自己','她','她','她','自己','它','它','本身','他们' ,'他们','他们','他们','他们','什么','哪个','谁','谁','这个','那个','这些','那些',' am','is','are','was','are','be','been','being','have','has','have','have','do' ,'做','做','做','a','an','the','和','但','if','或','因为','为','直到','','',','at','by','for','with','about','on','between','to',','through','' ,'之前','之后','上方','下方','来','来','上','下','进','出','开','关','超过','再次','进一步','然后','一次','这里','那里','何时','何处','为什么','如何','所有' ,'任何','两者','每个','少数','更多','最','其他','某些','这样','不','也','不','只有','拥有','相同','如此','比','太','非常','s','t','可以','将','只是','不' ,'应该','不 W']
我不明白的是,"为什么"这个词不存在?是否有必要确定句子内的情绪?例如,这样的句子:
我不确定问题是什么.
一旦not删除了禁用词,就会完全不同,将句子的含义改为对面(I am sure what the problem is).如果是这种情况,那么在不使用这些停用词时我是否缺少一套规则?
我需要一点点帮助,我需要识别"不好","不坏"等否定词,然后确定情绪的极性(消极或积极).除了处理否定之外,我做了一切.我只是想知道如何将否定纳入其中.我该怎么办呢?