Επιλέγοντας υποσύνολα δεδομένων στην R
Έστω πως έχουμε ένα μεγάλο σύνολο δεδομένων. πως μπορούμε να επιλέξουμε ένα υποσύνολο από αυτά;
Για παράδειγμα, έστω ο παρακάτω πίνακας δεδομένων:
x1 <- sample(1:10, 50, replace=T) x2 <- rnorm(50) x <- data.frame(x1, x2)Μερικές ερωτήσεις-απαντήσεις:
- Να βρεθεί η στήλη x1 με τιμές μεγαλύτερες του 5
subset(x, select=x1, x1>5)
- Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
subset(x, select=x2, x1>5)
- Να βρεθούν οι στήλες x1,x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
subset(x, select=c(x1,x2), x1>5)
- Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3
subset(x, select=x2, x1==3)
- Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3 ή 6
subset(x, select=x2, x1==3 | x1==6)
- Να βρεθεί οι στήλες x1,x2 εκεί όπου η στήλη x2 έχει τιμές (45,50]
subset(x, select=c(x1,x2), x2>45 & x2<=50)
Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.
Εκπαιδευτικό υλικό από τον
Αθανάσιο Σταυρακούδη
σας παρέχετε κάτω από την άδεια
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.