小编Mag*_*ggi的帖子

67
推荐指数
4
解决办法
15万
查看次数

Java - PDFBox - 文本提取

我一直在使用pdfbox从PDF中提取文本信息.我成功地解析了文本的所有属性,如fontname,fontface,size,position等.

问题:我使用的是pdfbox1.2.1(最新版本).TextPosition类中的getCharacter()返回除最后一个字符之外的完整字符串.最后一个字符被解析为单独的字符串.

例如:"你好吗"被解析为"如何哟"和"你"(2个单独的字符串).

我不希望它发生那种方式..

有没有人来过这个?..我做错了什么??等待回复..

谢谢和问候,Magggi

java pdfbox

5
推荐指数
1
解决办法
2480
查看次数

Java异常处理

即使在处理一组文件中的某些文件时发生异常,如何使用异常和异常处理来使我的程序继续?

我希望我的程序能够正常处理正确的文件,而对于那些导致程序异常的文件,它应该忽略.

问候,

magggi

java exception

5
推荐指数
2
解决办法
7117
查看次数

迭代和处理ArrayList

我有一个List对象.我想迭代这个对象列表并根据条件处理一些对象子集,最后创建一个新的对象列表,其中一些已处理的对象被删除.

做这个的最好方式是什么.?

例:

实际对象: List<Cars>

  1. 遍历此列表并Cars以相同的速度查找.
  2. 在较小的一组中Cars,要消除相同型号的那些.
  3. 最后消除后我得到了新的清单.

java filtering arraylist

4
推荐指数
1
解决办法
4109
查看次数

标签 统计

java ×4

arraylist ×1

comparable ×1

exception ×1

filtering ×1

pdfbox ×1