小编Ham*_*mad的帖子

如何从文本中查找肯定和否定单词的总数?

我想查找给定文本中匹配的肯定和否定单词的总数。我在positive.txt文件中有肯定词列表,在文件中有否定词列表negative.txt。如果一个单词与肯定单词列表中的单词匹配,那么我想要一个简单的整数变量,该变量的值增加1,与否定匹配单词相同。从我给定的代码中,我得到了下面的一段@class=[story-hed]。这是我要与肯定和否定单词列表以及单词总数进行比较的文本。我的代码是

from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
from dawn.items import DawnItem

class dawnSpider(BaseSpider):
   name = "dawn"
   allowed_domains = ["dawn.com"]
   start_urls = [
       "http://dawn.com/"
   ]

   def parse(self, response):

      hxs = HtmlXPathSelector(response)      
      sites = hxs.select('//h3[@class="story-hed"]//a/text()').extract()
      items=[]

      for site in sites:
         item=DawnItem()
         item['title']=site
         items.append(item)
      return items
Run Code Online (Sandbox Code Playgroud)

python file-io file web-crawler scrapy

1
推荐指数
1
解决办法
4192
查看次数

标签 统计

file ×1

file-io ×1

python ×1

scrapy ×1

web-crawler ×1