Διάγραμμα μήτρας συσχετίσεων (correlation matrix) με την R

Το διάγραμμα μήτρας συσχετίσεων είναι ένας πολύ παραστατικός τρόπος οπτικοποίησης των συντελεστών συσχέτισης πολλών μεταβλητών. Δημιουργείται εύκολα με τη βιβλιοθήκη corrplot. Αν δεν την έχετε, εγκαταστήστε τη:

> install.packages ('corrplot')

Θα δημιουργήσουμε ένα τυχαίο σετ δεδομένων με τρεις μεταβλητές, έτσι ώστε να υπάρχει κάποιο συσχέτιση μεταξύ τους. Στην πράξη βέβαια μπορεί να έχετε το οποιοδήποτε άλλο σετ δεδομένων.

> x  <- rnorm(100)
> y  <- 0.8*x + rnorm(100)
> z  <- -0.6*y + rnorm(100)
> data <- data.frame(cbind(x,y,z))

Η (τετραγωνική) μήτρα συσχετίσεων είναι :

> cor(data)
      x     y     z
x 1.0000000 0.8440923 -0.6285686
y 0.8440923 1.0000000 -0.5052804
z -0.6285686 -0.5052804 1.0000000

Προφανώς ο πίνακας είναι συμμετρικός. Πχ, ο συντελεστής γραμμικής συσχέτιση ανάμεσα στις μεταβλητές x,y είναι 0.548.

Το γράφημα που αντιστοιχεί στη μήτρα συσχετίσεων:

> library(corrplot)
> corr <- cor(data)
> corrplot(corr)

371a

Το μέγεθος κάθε κύκλου και το χρώμα του αντανακλούν την τιμή του συντελεστή συσχέτισης. Υπάρχουν πολλές άλλες επιλογές, πχ προβολής του πίνακα με αριθμούς ως ποσοστά:

> corrplot(corr, method="number")

371b

Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.

Creative Commons License
Εκπαιδευτικό υλικό από τον Αθανάσιο Σταυρακούδη σας παρέχετε κάτω από την άδεια Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.