小编Joc*_*cht的帖子

PDF和文本图层

根据此站点http://www.searchable-pdf.com/content.php?lang=en&c=61,可以在添加文本图层时搜索PDF.

我一直在寻找PDF的技术规范.我认为文本可以以两种方式存储到PDF中:a)作为图像层上方的文本层(如上面网页中所述)b)当您从Word文档(带文本)创建PDF时,我不会我认为Word将存储文本层中的所有文本.我认为它会将它存储在图像层中?对?

自PDF 1.4起,添加了XMP(http://en.wikipedia.org/wiki/Extensible_Metadata_Platform).但什么是XMP?这是我上面讨论的"文本层"吗?

如果扫描仪正在对图像执行OCR,是否将文本存储在"文本层"中?还是"XMP"领域?这只能是PDF版本为1.4时?

如何检测PDF是否已有文本数据?例如:PDF A已使用OCR扫描而PDF B未扫描.我怎么知道应该将PDF B发送到单独的OCR引擎?

pdf ocr scanning

10
推荐指数
2
解决办法
1万
查看次数

JPA getResultList()为MySQL返回BigInteger,但为Microsoft SQL Server返回Integer

我有以下方法:

Query q = getEntityManager().createNativeQuery("SELECT COUNT(1) FROM table1 WHERE column = :column_id " + "UNION " + "SELECT COUNT(1) FROM table2 WHERE column = :column_id");
q.setParameter("column_id", column_id);
Run Code Online (Sandbox Code Playgroud)

当我想获得计数列表(将是2行)时,我执行此操作:

List<BigInteger> counts = (List<BigInteger>) q.getResultList();
Run Code Online (Sandbox Code Playgroud)

这在MySQL中运行良好.但是一旦我连接到MS SQL服务器,我就会得到一个Integer对象列表:

List<Integer>
Run Code Online (Sandbox Code Playgroud)

知道为什么会有区别吗?

java mysql sql-server jpa

9
推荐指数
1
解决办法
1万
查看次数

Spring Boot 执行器页面返回 http 链接而不是 https

我有一个 Spring Boot 2.0.2 应用程序。当我浏览到以下 URL 时:https://my-domain-name/my-application-name/actuator,我得到以下输出:

{
    "_links": {
        "self": {
            "href": "http://my-domain-name/my-application-name/actuator",
            "templated": false
        },
        "health": {
            "href": "http://my-domain-name/my-application-name/actuator/health",
            "templated": false
        },
        "info": {
            "href": "http://my-domain-name/my-application-name/actuator/info",
            "templated": false
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

如您所见,内容还可以,但所有链接都以“http”开头,而不是以 https 开头。不过,我正在使用 HTTPS 访问 URL。

我尝试访问的域名是 AWS Route 53 记录,具有 AWS ELB 的别名。此 ELB 将调用重定向到 K8S 集群的目标。pod 本身正在运行 Nginx,它将 URL 重定向到另一个 pod,该 pod 运行带有嵌入式 Tomcat 的 Spring Boot,并且它使用 HTTP 和端口 8080 提供其内容。

对于 Nginx,有一个代理传递配置:

location /my-application-name { proxy_pass http://my-application-name; }
Run Code Online (Sandbox Code Playgroud)

正在添加以下标题:

proxy_set_header Host $http_host; …
Run Code Online (Sandbox Code Playgroud)

spring-boot

5
推荐指数
1
解决办法
414
查看次数

为什么Eclipse不断在我的工作区中重建项目?

我们正在使用JRebel快速将Java代码更改重新加载到我们的JVM中.这很棒!

但是,我们也使用Eclipse作为IDE.由于某种原因,Eclipse可以真正重建我的工作区中的整个项目,只是因为我添加了一个注释,我删除了一个方法,或者任何其他一些代码更改......由于这个重建阶段,所有类都被重新生成并且是必需的由JRebel重新加载.

没有办法调试为什么Eclipse总是重建我们的项目,即使是一个愚蠢的小代码更改?我正在使用Eclipse Indigo.

谢谢,Jochen

java eclipse jrebel

3
推荐指数
1
解决办法
3434
查看次数

正则表达式匹配字符串中单引号或双引号之间的单词

我正在寻找正确的正则表达式,为我提供以下结果:

  • 它需要将单/双引号包围的单词组合在一起
  • 当字符串中没有其他单引号时,它需要继续打印单引号
  • 当没有被单/双引号包围时 - 在空间上分开

我目前有:

Pattern pattern = Pattern.compile("[^\\s\"']+|\"([^\"]*)\"|'([^']*)'");
Run Code Online (Sandbox Code Playgroud)

......但以下示例并未完全奏效.谁可以帮我这个?

例子:

  • foo吧
    • group1:foo
    • 第2组:吧
    • 描述:拆分空间
  • "foo bar"
    • group1:foo bar
    • 说明:用双引号包围所以组foo和bar,但不要打印双引号
  • 'foo bar'
    • group1:foo bar
    • 描述:与上面相同,但有单引号
  • 'foo吧
    • group1:'foo
    • 第2组:吧
    • 描述:拆分空间并保持单引号
  • "'foo bar"
    • group1:'foo bar
    • 描述:用双引号包围所以组'foo和bar并保持单引号
  • foo bar'
    • group1:foo
    • group2:bar'
  • foo酒吧"
    • group1:foo
    • group2:bar"
  • "foo bar""堆栈溢出"
    • group1:foo bar
    • group2:堆栈溢出
  • "foo'bar""堆栈溢出"你好
    • group1:foo'bar
    • group2:堆栈溢出
    • 第3组:如何
    • group4:做
    • 第5组:你
    • group6:做

java regex

1
推荐指数
1
解决办法
7404
查看次数

标签 统计

java ×3

eclipse ×1

jpa ×1

jrebel ×1

mysql ×1

ocr ×1

pdf ×1

regex ×1

scanning ×1

spring-boot ×1

sql-server ×1