我正在编写代码来组合python rawdog RSS阅读器库和BeautifulSoup webscraping库中的函数.在我想要克服的内脏中存在冲突.
我可以用这个简化的代码复制问题:
import sys, gzip
def scrape(filename):
contents = gzip.open(filename,'rb').read()
contents = contents.decode('utf-8','replace')
import BeautifulSoup as BS
print 'before rawdog: ', len(BS.BeautifulSoup(contents)) # prints 4, correct answer
from rawdoglib import rawdog as rd
print 'after rawdog: ', len(BS.BeautifulSoup(contents)) # prints 3, incorrect answer
Run Code Online (Sandbox Code Playgroud)
无论什么顺序或我在哪里进行导入,rawdog的导入总是导致BS.BeautifulSoup()方法返回错误的响应.当我需要BeautifulSoup时,我实际上不再需要rawdog,所以我在那时尝试删除了包,但是BS仍然坏了.我尝试过的修复程序没有用到:
import BeautifulSoup从rawdog代码中删除并重新安装rawdogfor x in filter(lambda y: y.startswith('rawdog'), sys.modules.keys()): del sys.modules[x]from rawdoglib.rawdog import FeedStatefrom BeautifulSoup import BeautifulSoup as BSfrom __future__ import absolute_import没有运气,我总是得到len(BeautifulSoup(内容))== 3如果将rawdog导入命名空间.这两个软件包都很复杂,以至于我无法确切地知道问题重叠是什么,而且我不知道用什么工具来解决这个问题,除了搜索dir(BeautifulSoup)和dir( rawdog),我没有找到好的线索. …