如何使用Apache Tika通过Apache Metadata类提取"Subject"字段?

Cof*_*fee 0 java apache apache-tika

我正试图从电子邮件中提取"主题"字段,但遇到了一些麻烦.我已经能够获得"To"和"From"字段,如下所示:

String messageTo =  tikaMetadata.MESSAGE_TO;   //Works fine
String toField =  tikaMetadata.get(messageTo); //Works fine


System.out.println("From field is : " + fromField); //Works fine
System.out.println("To field is : "  + toField);    //Works fine


String messageSubj =  tikaMetadata.getValues("Message:Raw-Header:Subject"); 
String subjField =  tikaMetadata.get(messageTo); //Doesn't Work
Run Code Online (Sandbox Code Playgroud)

我们如何使用Tika提取主题领域?任何提示有用的谢谢

Nic*_* E. 6

您可以尝试两种方式:

  1. String subjectObs = tikaMetadata.get(tikaMetadata.SUBJECT); 但在哪里.SUBJECT被弃用

  2. String subject = tikaMetadata.get(TikaCoreProperties.DESCRIPTION);可能是最接近的替代品Metadata.SUBJECT(有关TikaCoreProperties的更多细节,请看:tika文档)