这个问题是不言自明的。
我面临的问题是我在网上找到的任何 Tika 示例代码都使用 StringWriter,如下所示。如果我能以某种方式使其使用 OutputStreamWriter,我可以指定编码没有问题...任何帮助将不胜感激。
InputStream inStream = new FileInputStream(pathname);
StringWriter sw = new StringWriter();
SAXTransformerFactory factory = (SAXTransformerFactory)SAXTransformerFactory.newInstance();
TransformerHandler handler = factory.newTransformerHandler();
handler.getTransformer().setOutputProperty(OutputKeys.METHOD,"html");
handler.getTransformer().setOutputProperty(OutputKeys.INDENT,"no");
handler.setResult(new StreamResult(sw));
parser.parse(inStream, handler, metadata, context);
Run Code Online (Sandbox Code Playgroud) 我需要从多个文件中提取原始文本,其中一些是 PDF,一些是 DOC 文件格式。
我必须使用 Apache POI 来执行此操作。现在,我找到了很多有关处理 Word 文件(提取和写入等)的文档,但我找不到任何有关从 PDF 中提取的文档。
我是否错误地相信 Apache POI 具有此功能?
如果是这样,有人可以推荐类似的允许从多种文件格式提取文本的Java程序吗?
如果没有,任何人都可以向我指出我应该查看的文档和/或类/方法来执行此操作吗?
预先感谢您的任何帮助。
我的问题是,当我试图在我试图创建的JApplet中设置背景颜色时,我无法获得除默认灰色之外的任何颜色.
如果有人能够不仅告诉我什么是错的,而且还要解释它,我真的很感激.这种技术是通过教科书学习的,因此,我想了解这个问题,以便我知道发生了什么.
任何和所有的帮助表示赞赏.
先感谢您,
SDG
public class QuoteApplet extends JApplet
{
public void paint (Graphics appPage)
{
setBackground(Color.YELLOW);
appPage.drawRect(65,55,255,100);
//page.drawRect(60,80,225,30);
//page.drawOval(75,65, 20, 20);
appPage.drawLine(30,30,30,100);
appPage.drawLine(40,30,40,100);
appPage.drawLine(55,45,15,85);
appPage.drawString("There once lived a man named Oedipus Rex.", 70, 70);
appPage.drawString("You may have heard about his odd complex.", 70, 90);
appPage.drawString("His name appears in Freud's index,", 70, 110);
appPage.drawString("'cause he loved his mother.", 70, 130);
appPage.drawString("-Tom Lehrer", 200, 150);
}
}
Run Code Online (Sandbox Code Playgroud) 在我写的代码中,我被告知要按以下方式在头文件中定义变量:
#define CLR_BLACK 0x0000
Run Code Online (Sandbox Code Playgroud)
因为这是我给出的唯一例子,我想知道带有#define命令的头文件中定义的所有变量是否都需要大写.例如,以下内容是否有效?
#define videoBuffer (u16*)0x6000000
Run Code Online (Sandbox Code Playgroud) java ×3
apache-poi ×1
apache-tika ×1
background ×1
c ×1
colors ×1
definition ×1
header-files ×1
japplet ×1
macros ×1
parsing ×1
pdf ×1
swing ×1