Mam migawki wielu stron internetowych wykonanych 2 razy. Jaka jest wiarygodna metoda określania, które strony zostały zmodyfikowane?sposób określania, czy strona internetowa została zmodyfikowana
Nie mogę polegać na czymś w rodzaju kanału RSS i muszę zignorować drobne zakłócenia, takie jak tekst daty.
Idealnie szukam rozwiązania Python, ale intuicyjny algorytm również byłby świetny.
Dzięki!
Czy masz na myśli obrazy, gdy mówisz migawki? Lub historyczny HTML? –
tylko kod HTML - brak plików pomocniczych – hoju
Czy chcesz zmienić strukturę (znaczniki html) lub zawartość, albo obie opcje? – elhoim