Czy wszystkie te typy witryn po prostu nielegalnie pobierają Google lub inną wyszukiwarkę?
O ile mogę powiedzieć, że nie ma "legalnego" sposobu na uzyskanie tych danych na stronie komercyjnej .. Yahoo! api (http://developer.yahoo.com/search/siteexplorer/V1/inlinkData.html) jest przeznaczony tylko do użytku niekomercyjnego, Yahoo! Szef nie zezwala na automatyczne zapytania itp.
Jakieś pomysły?W jaki sposób witryny takie jak Hubspot śledzą linki przychodzące?
Odpowiedz
Na przykład, jeśli chcesz znaleźć wszystkie linki do strony głównej Google, wyszukiwać
link:http://www.google.com
więc jeśli chcesz znaleźć wszystkie linków, można po prostu przechodzić drzewo witryny, a dla każdego element, który znajdzie, zbuduj URL. Następnie Google dla zapytania:
link:URL
a dostaniesz zbiór wszystkich linków, które Google od innych stron na swojej stronie.
Co się tyczy legalności takich zbiorów, jestem pewien, że nie jest to dokładnie legalne, aby czerpać z tego zyski, ale nigdy wcześniej nikogo to nie powstrzymało, prawda?
(Więc nie przejmuj się zastanawiać, czy zrobili to, czy nie. Po prostu zakładamy robią.)
nie wiem co HubSpot zrobić, ale jeśli chcesz dowiedzieć się, jakie strony odwołują się do Twojej witryny, a nie masz sprzętu do zaindeksowania sieci, możesz monitorować HTTP_REFERER odwiedzających Twoją witrynę. Jest to na przykład sposób, w jaki Google Analytics (o ile wiem) może ci powiedzieć, skąd pochodzą Twoi goście. To nie jest w 100% niezawodne, ponieważ nie wszystkie przeglądarki go ustawiają, szczególnie w "Trybie prywatności", ale potrzebujesz tylko jednego użytkownika na link, aby wiedzieć, że istnieje!
Jest to możliwe dzięki osadzeniu skryptu w każdej ze stron internetowych (często we wspólnym nagłówku lub stopce). Na przykład, jeśli przeanalizujesz źródło strony, którą właśnie czytasz, znajdziesz (bezpośrednio na dole) skrypt, który zgłasza się do informacji Google o Twojej wizycie.
Teraz nie powie Ci, czy istnieją linki, których nikt nigdy nie użył, aby dostać się do Twojej witryny, ale spójrzmy prawdzie w oczy, są one o wiele mniej interesujące niż te, których ludzie używają.
Dokładnie tak, jak sądzę - patrząc na przykładowe zrzuty ekranu w Hubspot, widać, że każdy śledzony link wejściowy miał od niego jednego odwiedzającego. Aby wyjaśnić, dane strony odsyłającej można uzyskać z dzienników lub za pomocą czegoś osadzonego w witrynie. –
- 1. W jaki sposób Alexa i Google Analytics śledzą dane demograficzne?
- 2. Jak działają witryny takie jak livescore.com?
- 3. Jaki jest najlepszy sposób generowania mapy witryny?
- 4. W jaki sposób można wykorzystać zdarzenia takie jak CancelEventArgs?
- 5. W jaki sposób CPU wprowadza instrukcje takie jak MUL/MULT?
- 6. W jaki sposób można klikać linki do kliknięcia EditText?
- 7. W jaki sposób Facebook uniemożliwia umieszczenie witryny w iFrame?
- 8. Dlaczego nie można uzyskać skali na Twitterze, dodając serwery w taki sposób, jaki mają witryny takie jak Facebook?
- 9. W jaki sposób ludzie sprawdzają swoje witryny w 2013 roku?
- 10. Jak wyciszyć połączenie przychodzące
- 11. W jaki sposób serwer WWW może obsługiwać przychodzące żądania wielu użytkowników jednocześnie na jednym porcie (80)?
- 12. W jaki sposób języki takie jak C# i Java unikają C/C++ - jak niezależna kompilacja?
- 13. W jakim formacie witryny takie jak Facebook służą do przechowywania danych dla profili osobistych?
- 14. Wiosenna integracja, w jaki sposób mogę przekazywać przychodzące żądania http za pośrednictwem bramy poczty wychodzącej?
- 15. Korzystając z D, w jaki sposób mogę odsłuchać przychodzące żądania HTTP i odpowiedzieć na nie?
- 16. W jaki sposób gry takie jak GTA IV nie rozbijają sterty?
- 17. W jaki sposób wdrożysz częściowe żądanie i odpowiedź, takie jak apk youtube, używając ServiceStack?
- 18. W jaki sposób biblioteki asemblacji, takie jak Chai, działają bez wymuszania wywołania funkcji?
- 19. W jaki sposób AngularJS wewnętrznie łapie zdarzenia takie jak "onclick", "onchange"?
- 20. W jaki sposób jest zaimplementowana klasa Object (metody takie jak hashCode i pola wewnętrzne)?
- 21. Jak usunąć niedziałające linki w Sitecore
- 22. zwalczaniu Android przychodzące aktywny pojawianiu
- 23. Analizy analiz nie śledzą zdarzeń niestandardowych
- 24. W jaki sposób mogę wyśrodkować te linki na pasku startowym bootstrap 3 na Twitterze?
- 25. W jaki sposób mogę sprawić, że crawler4j pobierze szybciej wszystkie linki ze strony?
- 26. Jaki jest właściwy sposób przechowywania globalnych zmiennych na poziomie witryny w witrynie programu SharePoint?
- 27. jak wykrywać przychodzące połączenia Skype/Viber
- 28. Bootstrap i odwiedzane linki
- 29. W jaki sposób instrukcja if i operacje bitowe są takie same w tym przykładzie?
- 30. Jak uzyskać przychodzące i wychodzące mydło xml w prosty sposób za pomocą Apache CXF?
Po prostu mogą czołgać się po Internecie ... strony takie jak http://www.80legs.com/ ułatwiają. –