403客户端错误:使用Twine上传新模块到pypi时出现无效或不存在的身份验证信息
\n\nWin10 Pro 1803 Biuld 17134.1069 64 位 // Python 3.7.5 32 位 // pip 19.3.1
\n\n我成功创建了 tar.gz 和whl。在 dist 文件夹中,通过电子邮件确认在https://pypi.org/上注册并开始上传。
\n\n我用命令行检查了这两个文件(\'PASSED\')
\n\n并做了以下事情:
\n\nUploading distributions to https://upload.pypi.org/legacy/\nEnter your username: gakonorde\nEnter your password:\nUploading gersyll-Alpha.release-py3-none-any.whl\n100%|\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88| 6.43k/6.43k [00:01<00:00, 5.12kB/s]\nNOTE: Try --verbose to see response content.\nHTTPError: 403 Client Error: Invalid or non-existent authentication information. for url: https://upload.pypi.org/legacy/\nRun Code Online (Sandbox Code Playgroud)\n\n命令行不允许我在用户名后输入密码。我只能按 ENTER 键。
\n\n我也尝试过
\n\nPassword for \'your-username\' in \'https://upload.pypi.org/legacy/\':\nRun Code Online (Sandbox Code Playgroud)\n\n...再一次,除了 ENTER 之外,我什么也不能按。
\n\n然后我使用https://pypi.org/及其测试版本的凭据创建.pypirc …
为了从多页 PDF 中获取单个字符串,我这样做:
import PyPDF2
pdfFileObject = open('sample.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObject)
count = pdfReader.numPages
for i in range(count):
page = pdfReader.getPage(i)
output = page.extractText()
output
Run Code Online (Sandbox Code Playgroud)
结果是来自单个页面(文档中的最后一页)的字符串 - 正如PyPDF2 文档中应有的那样。我应用这种方法是因为我读过一些人建议它阅读整个 PDF,但这对我来说不起作用。
显然,这是一个基本操作,对于我缺乏经验,我提前表示歉意。我尝试了其他解决方案,如 Tika、PDFMiner 和 Textract,但 PyPDF 似乎是迄今为止唯一让我满意的解决方案。
任何帮助,将不胜感激。
更新:
按照建议,我将 an 定义output为一个列表,然后将所有页面附加到它(正如我所想的)循环中,如下所示:
for i in range(count):
page = pdfReader.getPage(i)
output = []
output.append(page.extractText())
Run Code Online (Sandbox Code Playgroud)
结果是列表中的单个字符串,例如['sample content from the last page of PDF']