小编Cam*_*lia的帖子

如何使用 Python 抓取 PDF;仅具体内容

我正在尝试从网站上提供的 PDF 中获取数据

https://usda.library.cornell.edu/concern/publications/3t945q76s?locale=en

例如,如果我查看 2019 年 11 月的报告

https://downloads.usda.library.cornell.edu/usda-esmis/files/3t945q76s/dz011445t/mg74r196p/latest.pdf

我需要第 12 页上的玉米数据,我必须为期末库存、出口等创建单独的文件。我是 Python 新手,我不知道如何单独抓取内容。如果我能用一个月的时间弄清楚,那么我就可以创建一个循环。但是,我对如何继续处理一个文件感到困惑。

有人可以帮我吗,TIA。

python scrapy pdf-scraping web-scraping tabula

5
推荐指数
2
解决办法
4万
查看次数

标签 统计

pdf-scraping ×1

python ×1

scrapy ×1

tabula ×1

web-scraping ×1