Używam witryny, która umożliwia użytkownikom tworzenie subdomen. Chcę przesłać te subdomeny użytkowników do wyszukiwarek za pomocą map witryn. Jednak zgodnie z protokołem Sitemaps (i Narzędzi Google dla webmasterów) pojedyncza mapa witryny może zawierać adresy URL tylko z jednego hosta.Mapa strony witryny z dużą liczbą dynamicznych subdomen
Jakie jest najlepsze podejście?
W tej chwili mam następującą strukturę:
- indeksu mapy witryny znajdujący się example.com/sitemap-index.xml z listą map witryn dla każdej subdomeny (ale znajdujący się na tym samym serwerze).
- Każda poddomena ma własną mapę witryny zlokalizowaną pod adresem example.com/sitemap-domena.xml (w ten sposób indeks mapy witryny zawiera adresy URL tylko z jednego hosta).
- Mapa witryny dla subdomeny zawiera adresy z subdomeny tylko, czyli subdomain.example.com/*
- Każda subdomena ma subdomain.example.com/robots.txt plik:
-
.User-agent: *
Allow:/
Sitemap: http://example.com/sitemap-subdomain.xml
-
myślę, że to podejście jest zgodne z protokołem Sitemaps jednak Narzędzia Google dla webmasterów dać błędy na mapach witryn subdomeny: „URL nie pozwolił Ten adres URL nie jest dozwolone w przypadku mapy witryny w tej lokalizacji. "
Sprawdziłem również, jak robią to inne witryny. Eventbrite tworzy na przykład mapy witryn zawierające adresy URL z wielu poddomen (np. Zobacz http://www.eventbrite.com/events01.xml.gz). To jednak nie jest zgodne z protokołem Sitemaps.
Jakie podejście zaleca się w przypadku map witryn?
1) Nie mogę tego zrobić dla każdej poddomeny użytkownika. 2) Jak widzisz w moim pytaniu, już mam plik robots.txt z odpowiednią linią Sitemaps. To jednak nie pomaga - narzędzia Google dla webmasterów wciąż rzucają błędy. – bartekb
Może to być spowodowane tym, że narzędzie webmaster nie pobiera pliku robots.txt po przesłaniu mapy witryny, ale tylko podczas normalnego procesu indeksowania ... – bartekb
czy sprawdziłeś kartę "wszystkie" w raporcie map witryn Google dla maszyn dla webmasterów. mapa witryny przesłana za pomocą narzędzi Google dla webmasterów będzie nieważna, ale nie mapy witryn znajdujące się za kartą "wszystkie" (która zawiera także listę przesłanych map witryn z pliku robots.txt) –