标签: pipeline

Scrapy管道spider_opened和spider_closed没有被调用

我在scrapy管道上遇到了一些麻烦.我的信息正在从网站上删除,并正确调用process_item方法.但是没有调用spider_opened和spider_closed方法.

class MyPipeline(object):

    def __init__(self):
        log.msg("Initializing Pipeline")
        self.conn = None
        self.cur = None

    def spider_opened(self, spider):
        log.msg("Pipeline.spider_opened called", level=log.DEBUG)

    def spider_closed(self, spider):
        log.msg("Pipeline.spider_closed called", level=log.DEBUG)

    def process_item(self, item, spider):
        log.msg("Processsing item " + item['title'], level=log.DEBUG)

Run Code Online (Sandbox Code Playgroud)

无论是__init__和process_item日志消息持续显示在日志中,但spider_open和spider_close日志消息都没有.

我需要使用spider_opened和spider_closed方法,因为我想使用它们来打开和关闭与数据库的连接,但是在日志中没有显示任何内容.

如果有人有任何建议会非常有用.

python pipeline scrapy

Jim*_*ies

lucky-day

13
推荐指数

2
解决办法

5807
查看次数

使用Python设计可扩展的管道

背景:我目前正在使用Python代码为大型天文成像系统的数据减少管道.主要管道类通过许多离散处理"阶段"传递实验数据.

这些阶段是用单独的.py文件编写的,它们构成了一个包.在运行时生成可用阶段列表,以便用户可以选择运行数据的阶段.此方法的目的是允许用户在将来创建其他阶段.

问题:所有管道配置参数和数据结构(当前)位于主管道类中.有没有一种简单的方法可以在运行时导入的阶段中访问它们？

我目前的最佳尝试似乎"错误"并且有点原始,因为它使用循环导入和类变量.是否有一种方法可以让管道实例将引用传递给它自己作为它调用的每个阶段的参数？

这是我第一次编写一个大型python项目,而我缺乏设计知识.

任何帮助将不胜感激.

python pipeline

作者

2013 12-25

13
推荐指数

1
解决办法

5378
查看次数

powershell在什么条件下展开管道中的项目？

考虑以下:

function OutputArray{
    $l = @(,(10,20))
    $l
}

(OutputArray) -is [collections.ienumerable]
# C:\ PS> True
(OutputArray).Count
# C:\ PS> 2

Run Code Online (Sandbox Code Playgroud)

$l 当它进入管道时被"展开". 这个答案表明powershell展开了所有集合. 哈希表是一个集合.但是,哈希表当然不受管道的影响:

function OutputHashtable{
    $h = @{nested=@{prop1=10;prop2=20}}
    $h
}

(OutputHashtable) -is [collections.ienumerable]
# C:\ PS> True
(OutputHashtable).Count
# C:\ PS> 1

Run Code Online (Sandbox Code Playgroud)

这条评论表明,所有IEnumerable都转换为对象数组.但是,数组和散列表都是不可数的:

@(,(10,20)) -is [collections.ienumerable]
#True
@{nested=@{prop1=10;prop2=20}} -is [collections.ienumerable]
#True

Run Code Online (Sandbox Code Playgroud)

究竟,PowerShell将对象"展开"到管道中的条件是什么？

collections powershell ienumerable pipeline

alx*_*x9r

2017 05-23

13
推荐指数

1
解决办法

1638
查看次数

英特尔酷睿i7有多少个管道阶段？

它一次可以处理多少指令？

x86 pipeline

KFC*_*KFC

2015 06-29

12
推荐指数

2
解决办法

2万
查看次数

获取Array,List或Seq的第N个元素的不同参数顺序

在获取Array,List或Seq的第N个元素的函数中有不同的参数顺序是否有充分的理由:

Array.get source index
List .nth source index
Seq  .nth index  source

Run Code Online (Sandbox Code Playgroud)

我想使用管道运算符,它似乎只能用Seq:

s |> Seq.nth n

Run Code Online (Sandbox Code Playgroud)

有没有办法与Array或List使用相同的表示法？

f# pipeline

Pau*_*zak

2013 03-03

12
推荐指数

3
解决办法

1190
查看次数

Scrapy,Python:一个管道中的多个项目类？

我有一个Spider,它会抓取无法保存在一个项目类中的数据.

为了说明,我有一个配置文件项,每个配置文件项可能有未知数量的注释.这就是我想要实现Profile Item和Comment Item的原因.我知道我可以简单地通过使用yield将它们传递给我的管道.

但是,我不知道具有一个parse_item函数的管道如何处理两个不同的项类？
或者是否可以使用不同的parse_item函数？
或者我必须使用几个管道？
或者是否可以将Iterator写入Scrapy项目字段？

comments_list=[]
comments=response.xpath(somexpath)
for x in comments.extract():
        comments_list.append(x)
    ScrapyItem['comments'] =comments_list

Run Code Online (Sandbox Code Playgroud)

python pipeline scrapy

Nin*_*ina

2015 09-23

12
推荐指数

3
解决办法

7429
查看次数