2010-06-16 10 views
9

Wykonuję regresję najmniejszych kwadratów, jak poniżej (jednowymiarowy). Chciałbym wyrazić znaczenie wyniku w kategoriach R^2. Numpy zwraca wartość nieskalowanych pozostałości, co byłoby sensownym sposobem normalizacji tego.Konwersja wartości Numpy Lstsq na R^2

field_clean,back_clean = rid_zeros(backscatter,field_data) 
num_vals = len(field_clean) 
x = field_clean[:,row:row+1] 
y = 10*log10(back_clean) 

A = hstack([x, ones((num_vals,1))]) 
soln = lstsq(A, y) 
m, c = soln [0] 
residues = soln [1] 

print residues 

Odpowiedz

17

Patrz http://en.wikipedia.org/wiki/Coefficient_of_determination

Ustalona wartość R2 =

1 - residual/sum((y - y.mean())**2) 

co odpowiada

1 - residual/(n * y.var()) 

Jako przykład:

import numpy as np 

# Make some data... 
n = 10 
x = np.arange(n) 
y = 3 * x + 5 + np.random.random(n) 

# Note that polyfit is an easier way to do this... 
# It would just be "model, resid = np.polyfit(x,y,1,full=True)[:2]" 
A = np.vstack((x, np.ones(n))).T 
model, resid = np.linalg.lstsq(A, y)[:2] 

r2 = 1 - resid/(y.size * y.var()) 
print r2 
+0

Czy możemy wykonać tę operację w przypadku 'scipy.linalg.lstsq'!? – diffracteD

+0

i jak ten przykład "numpy" dotyczy danych 3D! nie mogąc tego zdobyć .. – diffracteD

Powiązane problemy