Począwszy Cairnarvon oświadczeniu podsumowującym:
„Wygląda na to główny powód PyPI potrzebuje lustra dlatego, że je ma.”
bym nieco zmodyfikować to:
To może być bardziej sposób PyPI faktycznie działa, a zatem musi być dublowane, które mogłyby przyczynić się dodatkowy kawałek (lub dwa :-) do prawdziwy ruch.
W tej chwili MUSISZ współdziałać z głównym indeksem, aby wiedzieć, co zaktualizować w swoim repozytorium. Stan jest nie tylko dostępny poprzez znaczniki czasu w niektórych publicznie dostępnych hierarchiach folderów.Tak więc, zła rzecz jest taka, że rsync jest poza równaniem. Dobrą rzeczą jest to, że MOŻNA rozmawiać z indeksem za pośrednictwem interfejsów JSON, OAuth, XML-RPC lub HTTP.
XML-RPC:
$> python
>>> import xmlrpclib
>>> import pprint
>>> client = xmlrpclib.ServerProxy('http://pypi.python.org/pypi')
>>> client.package_releases('PartitionSets')
['0.1.1']
Dla JSON np .:
$> curl https://pypi.python.org/pypi/PartitionSets/0.1.1/json
Jeśli są ok. 30 000 pakietów hostowanych [1] z niektórymi pobieranymi od 50 000 do 300 000 razy w tygodniu [2] (takich jak distribute, pip, requests, paramiko, lxml, boto, paramike, redis i inne) naprawdę potrzebujesz lusterek przynajmniej z perspektywy dostępności. Wyobraź sobie, co robi użytkownik, gdy pip install NeedThisPackage
nie powiedzie się: Poczekaj? Również szerokopasmowe mirrory PyPI są dość powszechne, działając jako serwery proxy dla sieci, które w przeciwnym razie nie są możliwe do podrobienia. Wreszcie nie zapomnij o cudownym sprawdzaniu wielu wersji włączonym przez virtualenv i znajomych. To wszystko jest zgodne z prawem IMO i potencjalnie wspaniałym wykorzystaniem pakietów ...
W końcu nigdy nie wiesz, co naprawdę robi agent z pobranym pakietem: Czy N użytkownicy naprawdę go używają lub po prostu go nadpisują następnym razem. .. i po wszystkim, autorzy pakietów IMHO powinni bardziej dbać o liczby i charakteru zastosowań, niż czysta liczby potencjalnych użytkowników ;-)
referencjach: the guestimated numery są od https://pypi.python.org/pypi (29303 pakiety) i http://pypi-ranking.info/week (dla cotygodniowego nu mbers, zgłoszony 2013-03-23).
gratulacje! nie widzę tego zachowania dla moich pakietów ... widzę niektóre pliki do pobrania, ale nie tak wiele (może 10-100 w nowej wersji?). może naprawdę masz użytkowników ?! powerlaws są dość modne ... –
Nie mogą być tak modne! Przesłałem również [another] (http://pypi.python.org/pypi/avalanchetoolbox), BARDZO specjalistyczny pakiet analiz naukowych (avalanchetoolbox) w tym samym czasie, który ma bardzo podobne zachowanie (> 1000 pobrań w ciągu 1,5 miesiąca we wszystkich wersjach). Na świecie nie ma tysiąca osób, które mogłyby uznać ten pakiet za interesujący, więc coś musi być nie w porządku. Jako że avalanchetoolbox polega na powerlaw, być może jedna osoba faktycznie zainteresowana pakietem ustawi zadanie cron, aby automatycznie sprawdzać i pobierać aktualizacje, a praca jest błędna? – jeffalstott
Przepraszam, spóźniłem się na herbatę, ale stackoverflow jest w pewnym sensie ponadczasowy, prawda? Zauważyłem, że PyPI oferuje plik binarny z systemem Windows .exe i tylko format pakietu tar.gz jako format pakietu źródłowego dla twojego pakietu powerlaw. Jeśli zamiast tego zaoferowałbyś .zip, .tar.bz2 i .tar.gz (wszystkie jako formaty źródłowe), możesz uzyskać * some * hint, odejmując nieco. ** Hipoteza **: użytkownik systemu Windows bierze .zip. Większość plików .tar.gz i .tar.bz2 może pochodzić z dublowania. Ma sens? – Dilettant