Planuję wykres rozproszenia z Pandas
. Rozumiem fabułę, z wyjątkiem krzywych na przekątnych poletkach. Czy ktoś może mi wyjaśnić, co mają na myśli?Zrozumienie przekątnej na wykresie macierzy rozproszonej Pandy
Obrazek:
Kod:
import pylab
import numpy as np
from pandas.tools.plotting import scatter_matrix
import pandas as pd
def make_scatter_plot(X, name):
"""
Make scatterplot.
Parameters:
-----------
X:a design matrix where each column is a feature and each row is an observation.
name: the name of the plot.
"""
pylab.clf()
df = pd.DataFrame(X)
axs = scatter_matrix(df, alpha=0.2, diagonal='kde')
for ax in axs[:,0]: # the left boundary
ax.grid('off', axis='both')
ax.set_yticks([0, .5])
for ax in axs[-1,:]: # the lower boundary
ax.grid('off', axis='both')
ax.set_xticks([0, .5])
pylab.savefig(name + ".png")
troche offtopic i uczyniłyby przykład mniej skoncentrowany, ale te działki prosić o skalach logarytmiczny (dobrym przykładem dlaczego: http://blogs.sas.com /content/iml/2014/07/09/scatter-plots-with-log-axes.html) –