在我的程序中,我有一个字符串(从外部库中获取),它与任何正则表达式都不匹配.
String content = // extract text from PDF
assertTrue(content.matches(".*")); // fails
assertTrue(content.contains("S P E C I A L")); // passes
assertTrue(content.matches("S P E C I A L")); // fails
Run Code Online (Sandbox Code Playgroud)
知道什么可能是错的吗?当我打印content到stdout时,它看起来不错.
以下是从PDF中提取文本的代码(我使用的是iText 5.0.1):
PdfReader reader = new PdfReader(source);
PdfTextExtractor extractor = new PdfTextExtractor(reader,
new SimpleTextExtractingPdfContentRenderListener());
return extractor.getTextFromPage(1);
Run Code Online (Sandbox Code Playgroud)