W przypadku większości witryn strony HTML są odwiedzane podczas korzystania z przeglądarki. Są to strony czytelne dla człowieka (raz wyrenderowane w przeglądarce), w których wiele danych może być stłoczonych razem, ponieważ ma to sens dla ludzi.
Teraz wyobraź sobie, że ktoś inny chce użyć niektórych z tych danych. Mogą pobrać twoją stronę i rozpocząć filtrowanie wszystkich "szumów", aby uzyskać żądane dane, ale większość stron internetowych nie jest zbudowana w taki sposób, że dane są w 100% pewne, że zostaną umieszczone w tym samym miejscu dla wszystkich elementów, więc dodatkowo bycie nieporęcznym również staje się niewiarygodne.
Wprowadź usługi internetowe.
Usługa internetowa to coś, co strona internetowa oferuje osobom, które chcą czytać, aktualizować i/lub usuwać dane z witryny. Możesz nazwać to "backdoorem" swoich danych. Zamiast prezentować dane jako część strony internetowej, jest ona dostarczana we wcześniej ustalony sposób, gdzie niektóre z bardziej popularnych to XML i JSON. Istnieje kilka sposobów komunikacji z serwisem internetowym, niektóre korzystają z SOAP, inne mają REST'owe usługi internetowe itp.
To, co jest wspólne dla wszystkich usług internetowych, to że są one odczytywalne maszynowo jako ekwiwalent do stron w witrynie inaczej oferuje. Oznacza to, że inni, którzy chcą korzystać z danych, mogą wysłać prośbę o odzyskanie pewnych danych, które można łatwo przeanalizować i wykorzystać. Niektóre witryny mogą wymagać podania nazwy użytkownika/hasła w żądaniu, w przypadku danych poufnych, podczas gdy inne witryny umożliwiają każdemu wyodrębnienie dowolnych danych, których mogą potrzebować.
to wyjaśnienie jest dobre, ale to, co łamie zdolność do konsumpcji losową liczbę całkowitą od drugiej progr jestem z HTML? Istnieje wiele bibliotek do czytania HTML i jest to to samo, co czytanie XML dla mnie i prawie tak samo jak czytanie JSON. Wiem, że ten post jest bardzo stary, ale proszę o komentarz, jeśli to możliwe. – Pavlo
Jest to kwestia raczej intencji niż zdolności. Intencją serwisu internetowego jest korzystanie z innych aplikacji. Intencją html jest renderowanie dla użytkownika przez przeglądarkę. –