相关疑难解决方法(0)

using (PdfReader reader = new PdfReader(fileName))
        {
            StringBuilder sb = new StringBuilder();

            ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
            for (int page = 0; page < reader.NumberOfPages; page++)
            {
                string text = PdfTextExtractor.GetTextFromPage(reader, page + 1, strategy);
                if (!string.IsNullOrWhiteSpace(text))
                {
                    sb.Append(Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(text))));
                }
            }

            var pdfText = sb.ToString();
        }

Run Code Online (Sandbox Code Playgroud)

在pdfText变量中，我将从pdf中获取所有文本内容，但这似乎不是获取发票编号的正确方法。还有其他方法可以通过其标签名称从pdf读取pdf的特定内容，例如我们将提供标签名称Invoice，并且它将返回值171857，例如与其他第三方pdf阅读器库一样？

任何帮助或建议，将不胜感激。

谢谢

c# pdf itext pdfparser

pro*_*011

2019 05-22

4
推荐指数

1
解决办法

566
查看次数