我使用 将一个大型 Excel 文件读入熊猫.read_excel,并且该文件具有日期列。当读入 Pandas 时,日期默认为时间戳。由于文件很大,我想将日期作为字符串读取。
如果这是不可能的,那么我至少想以与原始文件中相同的格式(例如“8/18/2009”)将日期导出回 Excel。
我的两个问题是:
我正在尝试从http://www.fayette-pva.com/下载所有 PDF 。
我认为问题在于,当将鼠标悬停在下载 PDF 的链接上时,Chrome 会在左下角显示没有.pdf文件扩展名的 URL 。我看到并使用了另一个与此类似的论坛答案,但是.pdf当将光标悬停在 PDF 链接上时,该扩展名用于 URL。我已经尝试了下面链接中的相同代码,但它没有选择 PDF 文件。
这是我一直在测试的代码:
wget --no-directories -e robots=off -A.pdf -r -l1 \
http://www.fayette-pva.com/sales-reports/salesreport03-feb-09feb2015/
Run Code Online (Sandbox Code Playgroud)
我在一个页面上使用它,我知道它上面有一个 PDF。
完整的代码应该是这样的
wget --no-directories -e robots=off -A.pdf -r http://www.fayette-pva.com/
Run Code Online (Sandbox Code Playgroud)
相关答案:WGET 问题从网站下载 pdfs
我不确定下载整个网站是否有效,以及它是否不会花很长时间。我如何解决这个问题并只下载 PDF?
我有一个 SAS 数据集,其中一些列包含 $。因此,它不是读取 67,349,而是读取 67,349 美元。如何从所有列中删除所有 $ 并让 SAS 将它们识别为数字?
只有几列带有美元符号,所以我可以一次做一列。我正在使用 SAS 的免费大学版。