标签: scrapinghub

2017-10-30 17:31:19+0000 [-] Log opened.\n2017-10-30 17:31:19+0000 [-] twistd 16.0.0 (/usr/bin/python 2.7.12) starting up.\n2017-10-30 17:31:19+0000 [-] reactor class: twisted.internet.epollreactor.EPollReactor.\n2017-10-30 17:31:19+0000 [-] Site starting on 6800\n2017-10-30 17:31:19+0000 [-] Starting factory <twisted.web.server.Site instance at 0x7f644752bfc8>\n2017-10-30 17:31:19+0000 [Launcher] Scrapyd 1.2.0 started: max_proc=4, runner=u\'scrapyd.runner\'\n

Run Code Online (Sandbox Code Playgroud)\n\n …

ubuntu scrapy scrapyd scrapinghub

Seb*_*ian

2017 11-02

2
推荐指数

1
解决办法

2339
查看次数

scrapy hub - exceptions.ImportError:没有名为pymodm的模块

我可以在本地运行我的scrapy没有任何问题,但是,当我尝试从scrapinghub运行工作时我得到以下错误(连接到mongo atlas云):

exceptions.ImportError: No module named pymodm

Run Code Online (Sandbox Code Playgroud)

我导入使用:

import pymodm

Run Code Online (Sandbox Code Playgroud)

任何帮助深表感谢.

干杯

mongodb scrapy scrapinghub pymodm

Rod*_*bio

2018 04-07

1
推荐指数

1
解决办法

461
查看次数

Scrapy,Scrapinghub和谷歌云存储:Keyerror'gs'在scrapinghub上运行蜘蛛

我正在使用Python 3进行scrapy项目,并将蜘蛛部署到scrapinghub.我也使用谷歌云存储来存储这里的官方文档中提到的已删除文件.

当我在本地运行蜘蛛并且蜘蛛被部署到scrapinghub而没有任何错误时,蜘蛛运行得非常好.我正在使用scrapy:1.4-py3作为scrapinghub的堆栈.在运行蜘蛛时,我收到以下错误:

    Traceback (most recent call last):
  File "/usr/local/lib/python3.6/site-packages/twisted/internet/defer.py", line 1386, in _inlineCallbacks
    result = g.send(result)
  File "/usr/local/lib/python3.6/site-packages/scrapy/crawler.py", line 77, in crawl
    self.engine = self._create_engine()
  File "/usr/local/lib/python3.6/site-packages/scrapy/crawler.py", line 102, in _create_engine
    return ExecutionEngine(self, lambda _: self.stop())
  File "/usr/local/lib/python3.6/site-packages/scrapy/core/engine.py", line 70, in __init__
    self.scraper = Scraper(crawler)
  File "/usr/local/lib/python3.6/site-packages/scrapy/core/scraper.py", line 71, in __init__
    self.itemproc = itemproc_cls.from_crawler(crawler)
  File "/usr/local/lib/python3.6/site-packages/scrapy/middleware.py", line 58, in from_crawler
    return cls.from_settings(crawler.settings, crawler)
  File "/usr/local/lib/python3.6/site-packages/scrapy/middleware.py", line 36, in from_settings
    mw = mwcls.from_crawler(crawler)
  File …

Run Code Online (Sandbox Code Playgroud)

scrapy python-3.x google-cloud-storage scrapinghub google-cloud-platform

Sag*_*rma

lucky-day

1
推荐指数

1
解决办法

725
查看次数

Scrapinghub shub部署错误-错误：部署失败（400）：项目：non_field_errors

当我尝试将其部署到云中并遇到以下错误时。

Error: Deploy failed (400):
project: non_field_errors

Run Code Online (Sandbox Code Playgroud)

我当前的设置如下。

def __init__(self, startUrls, *args, **kwargs):

    self.keywords = ['sales','advertise','contact','about','policy','terms','feedback','support','faq']

    self.startUrls = startUrls

    self.startUrls = json.loads(self.startUrls)

    super(MySpider, self).__init__(*args, **kwargs)

def start_requests(self):

    for url in self.startUrls:

        yield Request(url=url)

Run Code Online (Sandbox Code Playgroud)

scrapy python-2.7 scrapinghub

Bil*_*hon

2017 11-05

0
推荐指数

1
解决办法

385
查看次数