2013-07-30 18 views
5

Potrzebuję złom duży plik html (np: - http://www.indianrail.gov.in/mail_express_trn_list.html) za pomocą prostego html dom. Zacząłem z prostego skryptu ..prosty html dom złomowanie dużego pliku html

<?php 
require "simple_html_dom.php"; 
echo file_get_html('http://www.indianrail.gov.in/mail_express_trn_list.html')->plaintext; 
?> 

który pokazuje nic, tylko pustą stronę z komunikatem o błędzie w Apache error.log pliku

PHP Notice: Trying to get property of non-object in /var/www/index.php on line 3 
PHP Notice: Trying to get property of non-object in /var/www/index.php on line 3 

jednocześnie wszystkie inne strony (np: - http://www.indianrail.gov.in/special_trn_list.html) działa dobrze z tym samym skryptem. Potrzebujesz pomocy w tej sprawie

Z góry dziękuję.

+0

Czy próbowałeś użyć 'file_get_contents' zamiast' file_get_html'? http://php.net/manual/en/function.file-get-contents.php –

+0

Jestem w stanie powtórzyć problem, będę kopać głębiej i niech znasz – DevZer0

+0

@Fred próbowałem, ale ten sam błąd .. – krizna

Odpowiedz

12

Problem wydaje się być MAX_FILE_SIZE określony w simple_html_dom.

można dostosować, edytując wiersz define('MAX_FILE_SIZE', 600000); w pliku simple_html_dom.php.

+0

próbowałem zdefiniować ("MAX_FILE_SIZE", 6000000000000000000); .. ale bez powodzenia ... wciąż ten sam błąd .. dzięki – krizna

+4

zdefiniuj realistyczną liczbę, ustawiam ją na 12600000 – DevZer0

+0

to działa szwy, ale otrzymuję teraz inny błąd .. sygnał wyjścia Błąd segmentacji (11) – krizna