2012-07-03 7 views
6

Zajmuję się tworzeniem aplikacji w szynach, która wymaga sprawdzenia, czy wprowadzona witryna ma wygenerowane przyjazne dla wyszukiwarek adresy URL. Rozważam rozwiązanie, które służy do analizowania nokogiri HTML strony i spójrz w tag link do wyszukiwania adresów URL i zobacz, czy są one przyjazne dla wyszukiwarek. Czy jest jakiś inny sposób, aby to zrobić? Każda pomoc byłaby naprawdę świetna.Kod w Ruby, aby sprawdzić, czy witryna ma przyjazne adresy URL dla wyszukiwarek

+0

jeśli naprawdę chcesz przeglądać wszystkie linki na stronie, nokogiri jest drogą do zrobienia. jak planujesz odróżnić URL przyjazny dla SEO od przyjaznego SEO? –

+0

Nie mam pojęcia, jak to zrobię. Zajrzę się Anemone jako pierwszy, co sugerował @Casper. Czy masz inny sposób, który mógłby zadziałać w tej sprawie? Dzięki, –

+0

Niestety nie, po prostu byłem ciekawy; -) –

Odpowiedz

5

masz dwa problemy tutaj:

  1. Jak formalnie (programowo) definiują co "search engine frienldy URL". Zakładam, że już masz sposób na zrobienie tego. Więc to wychodzi ...

  2. Jak sprawdzić wszystkie linki na stronie internetowej.

Więc dla (2) Chciałbym spojrzeć na coś podobnego Anemone który pozwoli łatwo można indeksować kompletne strony internetowe:

Anemone jest biblioteką Ruby, który umożliwia szybkie i bezbolesne napisać programy, które pają ​​stronę internetową. Zapewnia prosty DSL do wykonywania akcji na każdej stronie witryny, pomijając określone adresy URL i obliczając najkrótszą ścieżkę do danej strony w witrynie.

Wielowątkowa konstrukcja sprawia, że ​​Anemone jest szybki. Interfejs API jest prosty. A ekspresyjność Ruby sprawia, że ​​jest potężna.

Do prostego indeksowania Anemone daje nawet zestaw wszystkich linków na stronie, więc niekoniecznie będziesz potrzebować Nokogiri. Dla bardziej skomplikowanych rzeczy może chcesz połączyć Anemone z czymś takim jak Mechanize i Nokogiri. To zależy od twoich wymagań.

+0

Dzięki za udostępnienie informacji na temat Anemone Gem, byłoby to bardzo przydatne dla mnie.I również nie znalazłem sposobu na (1) problem, więc jeśli masz pomóżcie o tym, więc podzielcie się tym również. –

+0

Zawilec jest niesamowity, rozwiązuje mój cel tutaj, Dzięki –

+0

@ JimmyThakkar - Dzięki za komentarze. Niestety nie mam żadnych dobrych pomysłów na linki SEO. To nie jest łatwy problem do rozwiązania. Chciałbym najpierw napisać na papierze, co to jest dobry link SEO. To znaczy. najpierw utwórz definicję na papierze! Następnie możesz spróbować sformułować dla niego algorytm. Ale najpierw musisz mieć zasady jasne. Może poszukaj pasujących słów kluczowych na stronie itp. Jednak ludzie mogą dość szybko sprawdzić, czy link jest SEO, czy nie. Wystarczy więc zaimplementować (2), aby wyświetlić listę linków i szybko zeskanować ponad 100 linków w zaledwie kilka sekund, po prostu patrząc na nie. – Casper

Powiązane problemy