相关疑难解决方法(0)

如何从PDF文件中提取文本？

我正在尝试使用提取此 PDF文件中包含的文本Python.

我正在使用PyPDF2模块,并具有以下脚本:

import PyPDF2
pdf_file = open('sample.pdf')
read_pdf = PyPDF2.PdfFileReader(pdf_file)
number_of_pages = read_pdf.getNumPages()
page = read_pdf.getPage(0)
page_content = page.extractText()
print page_content

Run Code Online (Sandbox Code Playgroud)

当我运行代码时,我得到以下输出,该输出与PDF文档中包含的输出不同:

!"#$%#$%&%$&'()*%+,-%./01'*23%4
5'%1$#26%3/%7/))/8%&)/26%8#3"%3"*%313/9#&)
%

Run Code Online (Sandbox Code Playgroud)

如何在PDF文档中提取文本？

python pdf

Sim*_*ity

2018 10-06

146
推荐指数

17
解决办法

24万
查看次数

如何在python中的列表中找到最相似的单词

我有一个单词列表

list = ['car', 'animal', 'house', 'animation']

Run Code Online (Sandbox Code Playgroud)

我想用字符串比较每个列表项,str1输出应该是最相似的单词.例如:如果str1是anlmal则animal是最相似的词.我怎么能在python中这样做？通常我列表中的单词可以很好地区分开来.

python

Joh*_*hnB

lucky-day

12
推荐指数

1
解决办法

1万
查看次数

标签统计

python ×2

pdf ×1

如何从PDF文件中提取文本？

如何在python中的列表中找到最相似的单词

标签 统计

标签统计