mam danych z dyskretnych wartości x, takie jakUsuwanie odstających łatwo w R
x = c(3,8,13,8,13,3,3,8,13,8,3,8,8,13,8,13,8,3,3,8,13,8,13,3,3)
y = c(4,5,4,6,7,20,1,4,6,2,6,8,2,6,7,3,2,5,7,3,2,5,7,3,2);
Jak można wygenerować nowy zestaw danych z wartościami x i y, gdzie wyeliminowania par wartości, w której wartość y jest 2 odchylenia standardowe powyżej średniej dla tego pojemnika. Na przykład, w pojemniku x = 3, 20 oznacza więcej niż 2 SD powyżej średniej, więc punkt danych powinien zostać usunięty.
powinno to być 'z $ y <średnie (z $ y) + 2 * sd (z $ y)'? kiedy OP wspomniał "wartość y wynosi 2 odchylenia standardowe powyżej średniej dla tego bin" – liuminzhao
@liuminzhao Myślę, że masz rację. – agstudy
@liuminzhao Aktualizuję swoją odpowiedź. Myślę, że mój błąd wynika z formułowania pytań (muszę poprawić mój angielski :)) – agstudy