not*_*ess 2 python database screen-scraping
我有几个月的编程经验。我目前正在学习如何在项目中自动化某些事情。我的目标是抓取文本、src 和 href 并将数据存储在我网站的数据库中,但是当我尝试时出现此错误
AttributeError: 'dict' object has no attribute 'text'
但确实如此。这是我的代码。我创建了一个函数
def get_world_too():
        url = 'http://www.example.com'
        html = requests.get(url, headers=headers)
        soup = BeautifulSoup(html.text, 'html5lib')
        titles = soup.find_all('section', 'box')[:9]
        entries = [{'href': box.a.get('href'),
                    'src': box.img.get('src'),
                    'text': box.strong.a.text,
                    'url': url
                    } for box in titles]
        return entries
然后我做了这个
def noindex(request):
    world = get_world_too()
    for entry in world:
        post = Post()
        post.title = entry.text
        post.image_url = entry.src
        # post.url = entry.url
        # post.link = entry.href
        # post.description = entry.description
        #
        # d = datetime.datetime(*(entry.published_parsed[0:6]))
        # date_string = d.strftime('%Y-%m-%d %H:%M:%S')
        #
        # post.publication_date = date_string
        post.save()
        template = "blog/post/noindex.html"
        context = {
        }
        return render(request, template, context)
我的函数中不是 text 属性吗?然后,如果我尝试注释掉文本,它会告诉我
AttributeError: 'dict' object has no attribute 'src'
我该如何解决这个问题,以便我想要的数据存储在我的数据库中而没有任何错误?如果这有所作为,我正在使用 django。
您必须像这样访问字典键:
entry['text']
entry['src']
不是这样
entry.text
entry.src