Mam dużą kolekcję (~ 2,7 miliona dokumentów) w mongodb i jest wiele duplikatów. Próbowałem uruchomić ensureIndex({id:1}, {unique:true, dropDups:true})
w kolekcji. Mongo odkłada go na chwilę, zanim zdecyduje, że too many dups on index build with dropDups=true
.Jak mogę usunąć duplikaty w MongoDb?
Jak dodać indeks i pozbyć się duplikatów? Lub na odwrót, jaki jest najlepszy sposób na usunięcie dupków, aby mongo mogło z powodzeniem zbudować indeks?
Jeśli chodzi o punkty bonusowe, dlaczego istnieje ograniczenie liczby duplikatów, które można upuścić?
Jako opcja: uruchom mapę/zmniejsz liczbę zliczeń dla każdego "identyfikatora". Następnie przejdź ten zestaw wyników i dla każdego "identyfikatora" z duplikatami usuń wszystkie rekordy, ale najpierw. –