Należy również pamiętać, że niektóre dane są zastrzeżone i są uważane przez ich właścicieli za własność intelektualną. Niektóre witryny, takie jak witryny wymiany walut, wyszukiwarki i narzędzia do śledzenia giełd, szczególnie nie lubią indeksowania swoich danych, ponieważ ich firma sprzedaje właśnie te dane, które indeksujesz.
W Stanach Zjednoczonych nie można same dane o prawach autorskich - tylko sposób formatowania danych. Zgodnie z amerykańskim prawem, pobieranie danych z indeksowaniem jest dopuszczalne, o ile nie przechowujesz ich w oryginalnym formacie (HTML).
Jednak w wielu krajach europejskich dane mogą być chronione prawem autorskim. A sieć to globalna bestia. Ludzie z Europy mogą odwiedzić Twoją witrynę. Co zgodnie z prawem w niektórych krajach oznacza, że prowadzisz interesy w tych krajach. Nawet jeśli jesteś prawnie chroniony w Stanach Zjednoczonych, nie oznacza to, że nie będziesz pozwany w innym miejscu na świecie.
Moja rada to przejść przez stronę i przeczytać o zasadach użytkowania. Jeśli witryna wyraźnie uniemożliwia indeksowanie, nie powinieneś tego robić. I jak wspomniał Jim, szanuj robots.txt.
Z drugiej strony, sądy na całym świecie mają prawny precedens, który sprawia, że wyszukiwarki są legalne. A wyszukiwarki to same żarłoczne roboty sieciowe. Z drugiej strony wygląda na to, że co najmniej co najmniej jedna agencja prasowa pozywa lub próbuje pozwać Google'a za indeksowanie stron internetowych.
Mając powyższe na uwadze, należy bardzo uważać, co robi się z przeszukiwanymi danymi. Powiedziałbym, że prywatny użytek jest OK, o ile nie przeładowujesz serwerów. Ja sam robię to regularnie, aby uzyskać program telewizyjny, itp.
+1. Spodobała mi się twoja odpowiedź. Wygląda na to, że ktoś próbuje sondować obcą planetę, sygnalizując i przywołując pokój, i może śledzić twoją odpowiedź jako przewodnik! : P –