相关疑难解决方法(0)

设置java语言环境设置

当我在我的linux机器上使用默认的java语言环境时,它提供了美国语言环境设置,我在哪里更改它以便它出现正确的语言环境?

java locale

34
推荐指数
6
解决办法
13万
查看次数

如何使用java或C#解析包含utf-8字符的pdf文件

我有一个pdf文件,其中包含utf-8字符(İ,ğ,ı和阿拉伯字母等).如何解析这个文件?
我使用itext和pdfBox,但我看到"çekti¤ikå¤> da"而不是"çektiğikağıda".我该如何解决这个问题?

c# java pdf parsing

6
推荐指数
1
解决办法
2561
查看次数

如何使用pdfbox将unicode文本写入pdf?

我尝试使用Apache PDFBox 1.8.6在中创建PDF Java。(请参见下面的代码)

如果我写字符串:Hello! 123 abc äöüß一切正常。
但是,如果我添加一个€符号或等效的\ u20ac,字符串就会搞砸了:
þÿ H e l l o ! 1 2 3 a b c ä ö ü ß ¬ ¬ ¦
我认为这与编码有关,因为像OpenOffice这样的程序可以毫无问题地导出带有€或其他Unicode符号的pdf。

那么,我该怎么做才能将Unicode字符串写入PDF?

try {
        PDDocument doc = new PDDocument();
        PDPage page = new PDPage();
        doc.addPage(page);
        PDPageContentStream stream = new PDPageContentStream(doc, page);
        PDFont font = PDType1Font.COURIER;
        //font.setFontEncoding(new EncodingManager().getEncoding(COSName.WIN_ANSI_ENCODING));
        stream.setFont(font, 14);
        stream.beginText();
        stream.setNonStrokingColor(Color.BLACK);
        stream.moveTextPositionByAmount(20, 750);
        String text = "Hello! 123 abc äöüß € \u20ac";
        //JOptionPane.showMessageDialog(null, text);
        stream.drawString(text); …
Run Code Online (Sandbox Code Playgroud)

java pdf pdfbox

6
推荐指数
1
解决办法
7591
查看次数

标签 统计

java ×3

pdf ×2

c# ×1

locale ×1

parsing ×1

pdfbox ×1