Jestem obecnie próbuje odczytać tekst z pliku PDF za pomocą iTextSharp stosując poniższy kod i przypisanie do pola tekstowego (multiline) - (Windows Desktop App)Czytaj matematyczne równanie przy użyciu iTextSharp
Uwaga: Ten kod działa poprawnie .
public string ReadPdfFile(string fileName)
{
StringBuilder text = new StringBuilder();
if (File.Exists(fileName))
{
PdfReader pdfReader = new PdfReader(fileName);
for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
text.Append(currentText);
}
pdfReader.Close();
}
return text.ToString();
}
ale mój plik pdf ma równanie
i wszystko Dostaję jest wyjście follwing
co można dodać, aby osiągnąć następujący tekst? Wszelka pomoc byłaby naprawdę doceniona!
Podniosłem to pytanie, ponieważ uważam to za interesujące, ale myślę, że to będzie naprawdę, bardzo trudne. W jaki sposób powstał plik pdf? Czy możesz to udostępnić? –
Jakiego rodzaju wyników masz nadzieję? Twoja ekspresja matematyczna nie może być wyrażona w Podstawowej płaszczyźnie wielojęzycznej. – usr2564301
@amedeevangasse Cóż, to całkiem proste. Sprawdź oprogramowanie lateksowe! Musisz włączyć tryb matematyczny, wprowadzić równania i daje wynik w formacie pdf. –