相关疑难解决方法(0)

如何使用iTextSharp进行文本格式化

我正在使用iTextSharp从PDF中读取文本内容.我也能读到这一点.但我正在丢失文字格式,如字体,颜色等.有没有办法获得格式.

以下是我用于确切文本的代码段 -

PdfReader reader = new PdfReader("F:\\EBooks\\AspectsOfAjax.pdf");
textBox1.Text = ExtractTextFromPDFBytes(reader.GetPageContent(1));

private string ExtractTextFromPDFBytes(byte[] input)
{
    if (input == null || input.Length == 0) return "";
    try
    {
        string resultString = "";
        // Flag showing if we are we currently inside a text object
        bool inTextObject = false;
        // Flag showing if the next character is literal  e.g. '\\' to get a '\' character or '\(' to get '('
        bool nextLiteral = false;
        // () Bracket nesting level. Text appears …

Run Code Online (Sandbox Code Playgroud)

.net c# itextsharp

Irf*_*aza

2012 09-07

20
推荐指数

1
解决办法

4万
查看次数

iTextSharp - 如何在页面上获取单词的位置

我正在使用iTextSharp和reader.GetPageContent方法从PDF中提取文本.我需要找到文档中找到的每个单词的矩形/位置.有没有办法使用iTextSharp获取PDF中单词的矩形/位置？

c# pdf itextsharp

Dav*_*ave

2010 03-04

15
推荐指数

1
解决办法

3万
查看次数

如何使用itextsharp从PDF读取表格？

我在从 pdf 文件读取表格时遇到问题。这是一个非常简单的 pdf 文件，包含一些文本和一个表格。我使用的工具是 itextsharp。我知道 PDF 中没有表格概念。经过一番谷歌搜索，有人说可以使用 itextsharp + 自定义 ITextExtractionStrategy 来实现。但我不知道如何开始。有人可以给我一些提示吗？或一小段示例代码？

干杯

pdf itext

Vic*_*tor

2020 07-21

6
推荐指数

1
解决办法

3万
查看次数

使用C#使用iTextsharp突出显示现有PDF的文本(颜色)

我想知道我们是否可以突出显示已PDF使用的文本(颜色)itextsharp？

我看到了创建新PDF等示例,同时我们可以应用颜色.我正在寻找可以从PDF获取大量文本并应用颜色并保存的地方.

这是我想要完成的事情,阅读PDF文件,解析文本并根据业务规则突出显示文本.

任何第三方dll建议也有效,这是我正在寻找的第一步opensource iTextsharp library.

.net c# asp.net itextsharp

use*_*043

2011 12-21

4
推荐指数

1
解决办法

2万
查看次数

iTextSharp 如何读取PDF文件中的表格

我正在努力将 PDF 转换为文本。我可以正确地从 PDF 中获取文本，但它的表结构很复杂。我知道 PDF 不支持表格结构，但我认为有一种方法可以正确获取单元格。嗯，例如：

我想转换成这样的文本：

> This is first example.

> This is second example.

Run Code Online (Sandbox Code Playgroud)

但是，当我将 PDF 转换为文本时，这些数据如下所示：

> This is This is

> first example. second example.

Run Code Online (Sandbox Code Playgroud)

如何才能正确获取值？

- 编辑：

以下是我如何将 PDF 转换为文本：

OpenFileDialog ofd = new OpenFileDialog();
        string filepath;
        ofd.Filter = "PDF Files(*.PDF)|*.PDF|All Files(*.*)|*.*";

        if (ofd.ShowDialog() == DialogResult.OK)
        {
            filepath = ofd.FileName.ToString();

            string strText = string.Empty;
            try
            {
                PdfReader reader = new PdfReader(filepath);

                for (int page = 1; page < reader.NumberOfPages; page++)
                {
                    ITextExtractionStrategy its …

Run Code Online (Sandbox Code Playgroud)

c# pdf itext

pse*_*ode

2016 12-02

2
推荐指数

1
解决办法

2万
查看次数