To może nie być optymalna odpowiedź, ale tu idzie:
Nie jestem pewien, czy narzędzie wiersza polecenia ma możliwości określić tekst regionów.
Co można zrobić, to użyć otoki Tesseract na innej platformie (EmguCV ma wbudowany Tesseract). Dostajesz zeskanowany obraz, wycinasz obszary tekstowe i przekazujesz je Tesseract jeden na raz. W ten sposób unikniesz również niedokładności w analizie układu strony Tesseract.
np.
Image<Gray,Byte> scannedImage = new Image<Gray,Byte>(path_to_scanned_image);
//assuming you know a text region
Image<Gray,Byte> textRegion = new Image(100,20);
scannedImage.ROI = new Rectangle(0,0,100,20);
scannedImage.copyTo(textRegion);
ocr.recognize(textRegion);
Hehe, to był mój plan rezerwowy jeśli tesseract nie akceptuje regiony :) – sashoalm