2012-07-19 14 views
5

Powiel możliwe:
HTML Scraping in PhpWyodrębnianie konkretnych danych ze strony WWW za pomocą PHP

Chciałbym wiedzieć, czy jest jakiś sposób, aby uzyskać od strony konkretny ciąg tekstu który jest aktualizowany co jakiś czas przy użyciu PHP. Szukałem "w całym Internecie" i niczego nie znalazłem. Właśnie widziałem, że preg_match może to zrobić, ale nie rozumiałem, jak z niego korzystać.

wyobrazić, że ta strona internetowa zawiera:

<div name="changeable_text">**GET THIS TEXT**</div> 

jaki sposób można zrobić to za pomocą PHP, po wykorzystaniu file_get_contents umieścić stronę w zmiennej?

góry dzięki :)

+0

Zapomnij o nazwie div. LOL –

+2

Temat, którego szukasz, to "skrobanie ekranu". Więcej informacji tutaj http://stackoverflow.com/tags/screen-scraping/info – jumpnett

Odpowiedz

10

Można użyć DOMDocument, tak:

$html = file_get_contents($url); 

libxml_use_internal_errors(true); 
$doc = new DOMDocument; 
$doc->loadHTML($html); 
$xpath = new DOMXpath($doc); 

// A name attribute on a <div>??? 
$node = $xpath->query('//div[@name="changeable_text"]')->item(0); 

echo $node->textContent; // This will print **GET THIS TEXT** 
+0

to mi pomoże :) –

0

Mówisz o data scraping: akt wydobywania danych z ludzkiego wyjścia czytelny. W twoim przypadku jest to, co jest pomiędzy tagami <div>. Użyj rozszerzenia PHP DOM, aby przejść do wybranego tagu i wyodrębnić dane. Wyszukiwarka Google dla samouczka PHP DOM.

0
$delements= file_get_html('url will go here'); 

foreach($elements->find('element') as $ele) { 

  //traverse according to your preferences 

} 

//return or output 
Powiązane problemy