小编sup*_*gob的帖子

使用 Apache TIKA 解析文本时如何指定编码?

这个问题是不言自明的。

我面临的问题是我在网上找到的任何 Tika 示例代码都使用 StringWriter,如下所示。如果我能以某种方式使其使用 OutputStreamWriter,我可以指定编码没有问题...任何帮助将不胜感激。

InputStream inStream = new FileInputStream(pathname);
StringWriter sw = new StringWriter();
SAXTransformerFactory factory = (SAXTransformerFactory)SAXTransformerFactory.newInstance();
TransformerHandler handler = factory.newTransformerHandler();
handler.getTransformer().setOutputProperty(OutputKeys.METHOD,"html");
handler.getTransformer().setOutputProperty(OutputKeys.INDENT,"no");
handler.setResult(new StreamResult(sw));
parser.parse(inStream, handler, metadata, context);
Run Code Online (Sandbox Code Playgroud)

java parsing apache-tika

5
推荐指数
1
解决办法
5683
查看次数

如何使用 Apache POI 从 PDF 中提取原始文本?

我需要从多个文件中提取原始文本,其中一些是 PDF,一些是 DOC 文件格式。

我必须使用 Apache POI 来执行此操作。现在,我找到了很多有关处理 Word 文件(提取和写入等)的文档,但我找不到任何有关从 PDF 中提取的文档。

我是否错误地相信 Apache POI 具有此功能?

如果是这样,有人可以推荐类似的允许从多种文件格式提取文本的Java程序吗?

如果没有,任何人都可以向我指出我应该查看的文档和/或类/方法来执行此操作吗?

预先感谢您的任何帮助。

java pdf text-extraction apache-poi

4
推荐指数
1
解决办法
7693
查看次数

无法设置JApplet背景颜色

我的问题是,当我试图在我试图创建的JApplet中设置背景颜色时,我无法获得除默认灰色之外的任何颜色.

如果有人能够不仅告诉我什么是错的,而且还要解释它,我真的很感激.这种技术是通过教科书学习的,因此,我想了解这个问题,以便我知道发生了什么.

任何和所有的帮助表示赞赏.

先感谢您,

SDG

public class QuoteApplet extends JApplet
{

    public void paint (Graphics appPage)
    {
        setBackground(Color.YELLOW);

        appPage.drawRect(65,55,255,100);
        //page.drawRect(60,80,225,30);
        //page.drawOval(75,65, 20, 20);
        appPage.drawLine(30,30,30,100);
        appPage.drawLine(40,30,40,100);
        appPage.drawLine(55,45,15,85);

        appPage.drawString("There once lived a man named Oedipus Rex.", 70, 70);
        appPage.drawString("You may have heard about his odd complex.", 70, 90);
        appPage.drawString("His name appears in Freud's index,", 70, 110);
        appPage.drawString("'cause he loved his mother.", 70, 130);
        appPage.drawString("-Tom Lehrer", 200, 150);
    }
}
Run Code Online (Sandbox Code Playgroud)

java swing background colors japplet

3
推荐指数
1
解决办法
2615
查看次数

预处理器宏定义是否需要在头文件中的CAPS中?

在我写的代码中,我被告知要按以下方式在头文件中定义变量:

#define CLR_BLACK 0x0000
Run Code Online (Sandbox Code Playgroud)

因为这是我给出的唯一例子,我想知道带有#define命令的头文件中定义的所有变量是否都需要大写.例如,以下内容是否有效?

#define videoBuffer (u16*)0x6000000
Run Code Online (Sandbox Code Playgroud)

c macros definition header-files c-preprocessor

1
推荐指数
1
解决办法
2214
查看次数