小编Goo*_*uJu的帖子

使用.NET VB或C#中的acrobat.tlb从.pdf中提取完整的带连字符的单词

我正在使用acrobat.tlb库解析.pdf

在连续删除连字符的新行中,连字符被分开.

例如ABC-123-XXX-987

解析为:
ABC
123
XXX
987

如果我使用iTextSharp解析文本,它会解析文件中显示的整个字符串,这是我想要的行为.但是,我需要在.pdf和iTextSharp中突出显示这些字符串(序列号),而不是将突出显示放在正确的位置...因此acrobat.tlb

我在这里使用此代码:http://www.vbforums.com/showthread.php?561501-RESOLVED-2003-How-to-highlight-text-in-pdf

 ' filey = "*your full file name including directory here*"
        AcroExchApp = CreateObject("AcroExch.App")
        AcroExchAVDoc = CreateObject("AcroExch.AVDoc")
        ' Open the [strfiley] pdf file
        AcroExchAVDoc.Open(filey, "")       

        ' Get the PDDoc associated with the open AVDoc
        AcroExchPDDoc = AcroExchAVDoc.GetPDDoc
        sustext = "accessorizes"
        suktext = "accessorises" 
        ' get JavaScript Object
        ' note jso is related to PDDoc of a PDF,
        jso = AcroExchPDDoc.GetJSObject
        ' count
        nCount = 0
        nCount1 = 0 …
Run Code Online (Sandbox Code Playgroud)

.net vb.net acrobat parsing

7
推荐指数
1
解决办法
186
查看次数

有人能给我一个例子,说明如何使用 PDFBox 提取“单词”的坐标

有人能给我一个例子,说明如何使用 PDFBox 提取“单词”的坐标

我正在使用此链接来提取单个字符的位置:https : //www.tutorialkart.com/pdfbox/how-to-extract-coordinates-or-position-of-characters-in-pdf/

我正在使用此链接来提取单词:https : //www.tutorialkart.com/pdfbox/extract-words-from-pdf-document/

我被困在获取整个单词的坐标。

coordinates pdfbox

1
推荐指数
1
解决办法
1367
查看次数

curl:(3)URL位置1中不匹配的括号:

我正在从此处运行Apache Solr教程:

http://lucene.apache.org/solr/guide/7_6/solr-tutorial.html

Solr正在运行,我可以在Web浏览器中运行查询。

教程中提到cURL了我不熟悉的内容。

我已经解压缩CURLC:\Curl和包括卷曲在PATH environment variableC:\Curl\curl-7.63.0-win64-mingw\bin

在Windows命令提示符下运行以下命令时,出现错误。我已经用谷歌搜索并尝试了无济于事的解决方案:

代码如下:

C:\Curl\curl-7.63.0-win64-mingw\bin>curl -X POST -H 'Content-type:application/json' --data-binary '{"add-field": {"name":"name", "type":"text_general", "multiValued":false, "stored":true}}' http://localhost:8983/solr/films/schema
Run Code Online (Sandbox Code Playgroud)

产生以下错误:

curl: (3) unmatched brace in URL position 1:
{name:name,
 ^
curl: (3) URL using bad/illegal format or missing URL
curl: (3) URL using bad/illegal format or missing URL
curl: (3) unmatched close brace/bracket in URL position 12:
stored:true}}'
           ^
{
  "responseHeader":{
    "status":400,
    "QTime":1},
  "error":{
    "metadata":[
      "error-class","org.apache.solr.common.SolrException",
      "root-error-class","org.apache.solr.common.SolrException"],
    "msg":"no …
Run Code Online (Sandbox Code Playgroud)

windows curl solr

0
推荐指数
1
解决办法
1296
查看次数

标签 统计

.net ×1

acrobat ×1

coordinates ×1

curl ×1

parsing ×1

pdfbox ×1

solr ×1

vb.net ×1

windows ×1