相关疑难解决方法(0)

在.Net中阅读PDF文档

有没有一个开源库可以帮助我在.Net/C#中阅读/解析PDF文档?

.net c# pdf

84
推荐指数
4
解决办法
16万
查看次数

在Itextsharp中使用ITextExtractionStrategy和LocationTextExtractionStrategy获取字符串坐标

我有一个PDF文件,我正在使用ITextExtractionStrategy.Now从字符串中读取字符串我正在采用子字符串My name is XYZ,需要从PDF文件中获取子字符串的矩形坐标但不能这样做.在googling我知道那个LocationTextExtractionStrategy,但没有得到如何使用该工具来获取坐标.

这是代码..

ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
text.Append(currentText);

string getcoordinate="My name is XYZ";
Run Code Online (Sandbox Code Playgroud)

如何使用ITEXTSHARP获取此子字符串的直角坐标..

请帮忙.

c# itextsharp

18
推荐指数
3
解决办法
4万
查看次数

如何将PDF文件中的行提取到csv文件中?

我想从这个PDF文件中获取美国所有大学的列表,并将其放入CSV文件中.然后我将CSV文件导入SQL服务器(这样我就可以轻松运行查询).

我尝试了几个在线pdf到csv转换器和基于Java的pdf到CSV教程.没有任何效果.今天我花了6-8个小时才完成这项工作并且失败了.当我导入csv时,我的csv文件搞砸了,我的数据库中有很多空值.我甚至尝试过搜索DHS api,它可以给我这个信息,但没有找到.

有人可以帮我提取大学,就像他们在pdf文件中显示的那样吗?

PS:你也可以看到所有大学使用这个网址.但是,您必须手动滚动以提取所有结果.这将花费太长时间,数据不会采用pdf文件中给出的格式.

pdf

4
推荐指数
2
解决办法
3262
查看次数

标签 统计

c# ×2

pdf ×2

.net ×1

itextsharp ×1