W moim programie mam ciąg (uzyskany z zewnętrznej biblioteki), który nie pasuje do żadnego wyrażenia regularnego.string.matches (". *") Zwraca fałsz
String content = // extract text from PDF
assertTrue(content.matches(".*")); // fails
assertTrue(content.contains("S P E C I A L")); // passes
assertTrue(content.matches("S P E C I A L")); // fails
Każdy pomysł, co może być nie tak? Kiedy wypiszę content
na standardowe wyjście, wszystko wygląda dobrze.
Oto kod do wydobywania tekstu z PDF (używam iText 5.0.1):
PdfReader reader = new PdfReader(source);
PdfTextExtractor extractor = new PdfTextExtractor(reader,
new SimpleTextExtractingPdfContentRenderListener());
return extractor.getTextFromPage(1);
oznaczone jako ulubione, ponieważ nie pierwszy raz zostałem trafiony przez taką bombę java. –