小编Cam_lia的帖子

如何使用 Python 抓取 PDF；仅具体内容

我正在尝试从网站上提供的 PDF 中获取数据

https://usda.library.cornell.edu/concern/publications/3t945q76s?locale=en

例如，如果我查看 2019 年 11 月的报告

https://downloads.usda.library.cornell.edu/usda-esmis/files/3t945q76s/dz011445t/mg74r196p/latest.pdf

我需要第 12 页上的玉米数据，我必须为期末库存、出口等创建单独的文件。我是 Python 新手，我不知道如何单独抓取内容。如果我能用一个月的时间弄清楚，那么我就可以创建一个循环。但是，我对如何继续处理一个文件感到困惑。

有人可以帮我吗，TIA。

python scrapy pdf-scraping web-scraping tabula

5
推荐指数

2
解决办法

4万
查看次数

标签统计

pdf-scraping ×1

web-scraping ×1