Διάγραμμα μήτρας συσχετίσεων (correlation matrix) με την R
Το διάγραμμα μήτρας συσχετίσεων είναι ένας πολύ παραστατικός τρόπος οπτικοποίησης των συντελεστών συσχέτισης πολλών μεταβλητών. Δημιουργείται εύκολα με τη βιβλιοθήκη corrplot. Αν δεν την έχετε, εγκαταστήστε τη:
> install.packages ('corrplot')
Θα δημιουργήσουμε ένα τυχαίο σετ δεδομένων με τρεις μεταβλητές, έτσι ώστε να υπάρχει κάποιο συσχέτιση μεταξύ τους. Στην πράξη βέβαια μπορεί να έχετε το οποιοδήποτε άλλο σετ δεδομένων.
> x <- rnorm(100) > y <- 0.8*x + rnorm(100) > z <- -0.6*y + rnorm(100) > data <- data.frame(cbind(x,y,z))
Η (τετραγωνική) μήτρα συσχετίσεων είναι :
> cor(data) x y z x 1.0000000 0.8440923 -0.6285686 y 0.8440923 1.0000000 -0.5052804 z -0.6285686 -0.5052804 1.0000000
Προφανώς ο πίνακας είναι συμμετρικός. Πχ, ο συντελεστής γραμμικής συσχέτιση ανάμεσα στις μεταβλητές x,y είναι 0.548.
Το γράφημα που αντιστοιχεί στη μήτρα συσχετίσεων:
> library(corrplot) > corr <- cor(data) > corrplot(corr)
Το μέγεθος κάθε κύκλου και το χρώμα του αντανακλούν την τιμή του συντελεστή συσχέτισης. Υπάρχουν πολλές άλλες επιλογές, πχ προβολής του πίνακα με αριθμούς ως ποσοστά:
> corrplot(corr, method="number")
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.
Εκπαιδευτικό υλικό από τον
Αθανάσιο Σταυρακούδη
σας παρέχετε κάτω από την άδεια
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.