小编Too*_*iry的帖子

使用SqlAlchemy将数据保存到数据库中，对象不可下标

我正在尝试将一些数据插入到数据库中，不幸的是它失败了并且没有保存，我怀疑我的数据结构不好。在尝试保存“打印（标题，链接，日期）”之前，数据在 process_item 中被很好地打印出来（每个对象 1 个标题、链接和日期），但是它无法保存它。标题、链接和日期各包含 1 个字符串...

感谢您的帮助

错误：

"Traceback (most recent call last):
  File "spider.py", line 63, in <module>
    presstv = spider_html(presstv_url, presstv_extract_item, presstv_xpath, presstv_pipeline)
  File "spider.py", line 58, in spider_html
    pipeline.process_item(extract_function(element), None)
  File "/Users/dav/Projects/python/news/pipeline.py", line 76, in process_item
    if session.query(Presstv).filter_by(link=item['link']) == None:
TypeError: 'Presstv' object is not subscriptable"

Run Code Online (Sandbox Code Playgroud)

代码

from sqlalchemy.orm import sessionmaker
from sqlalchemy import create_engine
from models import Nordfront, Presstv, db_connect, create_presstv_table
import json



class PresstvPipeline(object):
    """Pipeline for storing scraped items in the database"""
    def __init__(self): …

Run Code Online (Sandbox Code Playgroud)

python sqlalchemy python-3.x

Too*_*iry

lucky-day

4
推荐指数

1
解决办法

6849
查看次数

Python XML解析,lxml,urllib.request

我试图解析从url检索到的XML文件有点困难,我的目标是将这个xml文件放到一个结构良好的对象中,以便轻松检索其数据.我当前的代码导致以下错误:

>>> tree = etree.parse(data)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "lxml.etree.pyx", line 3299, in lxml.etree.parse (src/lxml/lxml.etree.c:72421)
  File "parser.pxi", line 1791, in lxml.etree._parseDocument (src/lxml/lxml.etree.c:105883)
  File "parser.pxi", line 1817, in lxml.etree._parseDocumentFromURL (src/lxml/lxml.etree.c:106182)
  File "parser.pxi", line 1721, in lxml.etree._parseDocFromFile (src/lxml/lxml.etree.c:105181)
  File "parser.pxi", line 1122, in lxml.etree._BaseParser._parseDocFromFile (src/lxml/lxml.etree.c:100131)
  File "parser.pxi", line 580, in lxml.etree._ParserContext._handleParseResultDoc (src/lxml/lxml.etree.c:94254)
  File "parser.pxi", line 690, in lxml.etree._handleParseResult (src/lxml/lxml.etree.c:95690)
  File "parser.pxi", line 618, in lxml.etree._raiseParseError (src/lxml/lxml.etree.c:94722)
OSError: Error reading file '<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" …

Run Code Online (Sandbox Code Playgroud)

python xml lxml urllib

Too*_*iry

lucky-day

3
推荐指数

1
解决办法

4161
查看次数