小编Gav*_*vrk的帖子

403 客户端错误:使用 twine 上传到 Pypi 时身份验证信息无效或不存在

403客户端错误:使用Twine上传新模块到pypi时出现无效或不存在的身份验证信息

\n\n

Win10 Pro 1803 Biuld 17134.1069 64 位 // Python 3.7.5 32 位 // pip 19.3.1

\n\n

我成功创建了 tar.gz 和whl。在 dist 文件夹中,通过电子邮件确认在https://pypi.org/上注册并开始上传。

\n\n

我用命令行检查了这两个文件(\'PASSED\')

\n\n

并做了以下事情:

\n\n
Uploading distributions to https://upload.pypi.org/legacy/\nEnter your username: gakonorde\nEnter your password:\nUploading gersyll-Alpha.release-py3-none-any.whl\n100%|\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88\xe2\x96\x88| 6.43k/6.43k [00:01<00:00, 5.12kB/s]\nNOTE: Try --verbose to see response content.\nHTTPError: 403 Client Error: Invalid or non-existent authentication information. for url: https://upload.pypi.org/legacy/\n
Run Code Online (Sandbox Code Playgroud)\n\n

命令行不允许我在用户名后输入密码。我只能按 ENTER 键。

\n\n

我也尝试过

\n\n
Password for \'your-username\' in \'https://upload.pypi.org/legacy/\':\n
Run Code Online (Sandbox Code Playgroud)\n\n

...再一次,除了 ENTER 之外,我什么也不能按。

\n\n

然后我使用https://pypi.org/及其测试版本的凭据创建.pypirc …

python upload pypi http-status-code-403 twine

6
推荐指数
2
解决办法
4445
查看次数

如何使用 PyPDF2 在 Python 3 中将 PDF 中的所有页面作为单个字符串检索

为了从多页 PDF 中获取单个字符串,我这样做:

import PyPDF2
pdfFileObject = open('sample.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObject)
count = pdfReader.numPages
for i in range(count):
    page = pdfReader.getPage(i)
    output = page.extractText()
output
Run Code Online (Sandbox Code Playgroud)

结果是来自单个页面(文档中的最后一页)的字符串 - 正如PyPDF2 文档中应有的那样。我应用这种方法是因为我读过一些人建议它阅读整个 PDF,但这对我来说不起作用。

显然,这是一个基本操作,对于我缺乏经验,我提前表示歉意。我尝试了其他解决方案,如 Tika、PDFMiner 和 Textract,但 PyPDF 似乎是迄今为止唯一让我满意的解决方案。

任何帮助,将不胜感激。

更新:

按照建议,我将 an 定义output为一个列表,然后将所有页面附加到它(正如我所想的)循环中,如下所示:

for i in range(count):
    page = pdfReader.getPage(i)
    output = []
    output.append(page.extractText())
Run Code Online (Sandbox Code Playgroud)

结果是列表中的单个字符串,例如['sample content from the last page of PDF']

python pdf pypdf python-3.x pdf-extraction

5
推荐指数
1
解决办法
2万
查看次数