Jak uzyskać kod HTML strony internetowej w PHP?

Chcę pobrać kod HTML linku (strony WWW) w PHP. Na przykład, jeśli link jestJak uzyskać kod HTML strony internetowej w PHP?

https://stackoverflow.com/questions/ask

potem chcę kod HTML strony, który jest lepszy. Chcę pobrać ten kod HTML i zapisać go w zmiennej PHP.

Jak mogę to zrobić?

Źródło

2009-05-04 Prashant

Czy możesz wyjaśnić to jeszcze bardziej. Chcesz wysłać żądanie sieciowe pod wskazany URL i odczytać odpowiedź na zmienną? –

Tak, tego samego chcę, chcę całego kodu źródłowego w zmiennej zwracanej przez to żądanie WWW. – Prashant

Możesz użyć [tego narzędzia] (http://codecanyon.net/item/javascript-web-scraper/8598806), aby łatwo pozbyć się html. –

Jeśli serwer PHP pozwala owijarki url fopen wówczas najprostszym sposobem jest:

$html = file_get_contents('http://stackoverflow.com/questions/ask');

Jeśli potrzebujesz większej kontroli następnie należy spojrzeć na funkcje cURL:

$c = curl_init('http://stackoverflow.com/questions/ask'); 
curl_setopt($c, CURLOPT_RETURNTRANSFER, true); 
//curl_setopt(... other options you want...) 

$html = curl_exec($c); 

if (curl_error($c)) 
    die(curl_error($c)); 

// Get the status code 
$status = curl_getinfo($c, CURLINFO_HTTP_CODE); 

curl_close($c);

Źródło

2009-05-04 08:02:20 Greg

Martwię się o 404. Jeśli link nie istnieje, to nie chcę jego zawartości, zamiast tego chcę wyświetlić komunikat o błędzie? Jak przekonamy się, że adres URL podaje błąd 404 lub nie (po prostu adres URL działa, czy nie)? – Prashant

@Prashant: Edytowałem, aby dodać wywołanie curl_getinfo, które da ci 200 lub 404 lub cokolwiek innego – Greg

Jak to jest możliwe, że PHP pobiera bieżący HTML strony? –

przyjrzeć się tej funkcji :

http://ru.php.net/manual/en/function.file-get-contents.php

Źródło

2009-05-04 08:02:21 Sergei

Prosty sposób: Zastosowanie file_get_contents():

$page = file_get_contents('http://stackoverflow.com/questions/ask');

Należy pamiętać, że musi być trueallow_url_fopen w was php.ini, aby móc korzystać z URL-aware fopen owijarki.

Bardziej zaawansowany sposób: Jeśli nie można zmienić konfigurację PHP, allow_url_fopen jest false domyślnie i jeśli jest zainstalowany ext/curl, użyj cURL library aby połączyć się z żądaną stroną.

Źródło

2009-05-04 08:04:11

Możesz sprawdzić bibliotek YQL z Yahoo: http://developer.yahoo.com/yql

Zadanie pod ręką jest tak proste jak

select * from html where url = 'http://stackoverflow.com/questions/ask'

Można spróbować tego w konsoli pod adresem: http://developer.yahoo.com/yql/console (wymaga zalogowania)

zobaczyć także Chris Heilmanns screencast na kilka ciekawych pomysłów, co jeszcze można zrobić: http://developer.yahoo.net/blogs/theater/archives/2009/04/screencast_collating_distributed_information.html

Źródło

2009-05-04 08:45:37 Ickmund

Jeśli chcesz jakoś manipulować pobraną stroną, możesz wypróbować parser PHP php. Uważam, że PHP Simple HTML DOM Parser jest bardzo łatwy w użyciu.

Źródło

2009-05-04 09:01:07 Dmitri

możesz użyć file_get_contents, jeśli chcesz przechowywać źródło jako zmienną, ale curl jest lepszym ćwiczeniem.

$url = file_get_contents('http://example.com'); 
echo $url;

to rozwiązanie wyświetli stronę w witrynie. Jednak curl jest lepszą opcją.

Źródło

2013-01-27 02:17:43 piglot

Oto dwa różne, prostych sposobów, aby uzyskać zawartość z URL:

1) Pierwsza metoda

Włącz allow_url_include z hostingu (PHP.ini albo gdzieś)

<?php 
$variableee = readfile("http://example.com/"); 
echo $variableee; 
?>

lub

2) Druga metoda

Włącz php_curl, php_imap i php_openssl

<?php 
// you can add anoother curl options too 
// see here - http://php.net/manual/en/function.curl-setopt.php 
function get_dataa($url) { 
    $ch = curl_init(); 
    $timeout = 5; 
    curl_setopt($ch, CURLOPT_URL, $url); 
    curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0)"); 
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST,false); 
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER,false); 
    curl_setopt($ch, CURLOPT_MAXREDIRS, 10); 
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); 
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 
    $data = curl_exec($ch); 
    curl_close($ch); 
    return $data; 
} 

$variableee = get_dataa('http://example.com'); 
echo $variableee; 
?>

Źródło

2013-04-03 13:36:44

include_once('simple_html_dom.php'); 
$url="http://stackoverflow.com/questions/ask"; 
$html = file_get_html($url);

można dostać cały kod HTML w postaci array (parsowana forma) za pomocą tego kodu Pobierz plik "simple_html_dom.php" tutaj http://sourceforge.net/projects/simplehtmldom/files/simple_html_dom.php/download

Źródło

2013-12-18 12:20:07 sarath

Jak uzyskać kod HTML strony internetowej w PHP?

Odpowiedz

Powiązane problemy