Próbuję zoptymalizować oprogramowanie, które generuje miliony testów. Testy te są generowane w taki sposób, że mogą występować pewne powtórzenia. Oczywiście nie chcę tracić czasu na przeprowadzanie testów, które już uruchomiłem, jeśli mogę skutecznie tego uniknąć.Naprzeciwko filtra Blooma?
Zastanawiam się, czy użyć filtru Bloom do przechowywania testów, które już zostały uruchomione. Jednak filtr Bloom'a błądzi mnie po niebezpiecznej stronie. Daje fałszywe alarmy. Oznacza to, że może on zgłosić, że przeprowadziłem test, którego nie zrobiłem. Chociaż może to być dopuszczalne w scenariuszu, nad którym pracuję, zastanawiałem się, czy istnieje odpowiednik filtru Blooma, ale błądzę po przeciwnej stronie, to znaczy podaję tylko fałszywe negatywy.
Przeszukałem literaturę bez powodzenia.
http://cstheory.stackexchange.com/questions/6596/a-probabilistic-set-with-no-false-positives –
Dla kompletności, może to być interesujące: https://github.com/ jmhodges/opposite_of_a_bloom_filter – Dave
Jest jedna taka rzecz z zabawną nazwą "Opposite of a Bloom Filter". Kod: https://github.com/jmhodges/opposite_of_a_bloom_filter blog: http://www.somethingsimilar.com/2012/05/21/the-opposite-of-a-bloom-filter/ – ib84