Επιλέγοντας υποσύνολα δεδομένων στην R
Έστω πως έχουμε ένα μεγάλο σύνολο δεδομένων. πως μπορούμε να επιλέξουμε ένα υποσύνολο από αυτά;
Για παράδειγμα, έστω ο παρακάτω πίνακας δεδομένων:
x1 <- sample(1:10, 50, replace=T) x2 <- rnorm(50) x <- data.frame(x1, x2)Μερικές ερωτήσεις-απαντήσεις:
- Να βρεθεί η στήλη x1 με τιμές μεγαλύτερες του 5
subset(x, select=x1, x1>5)
- Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
subset(x, select=x2, x1>5)
- Να βρεθούν οι στήλες x1,x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
subset(x, select=c(x1,x2), x1>5)
- Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3
subset(x, select=x2, x1==3)
- Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3 ή 6
subset(x, select=x2, x1==3 | x1==6)
- Να βρεθεί οι στήλες x1,x2 εκεί όπου η στήλη x2 έχει τιμές (45,50]
subset(x, select=c(x1,x2), x2>45 & x2<=50)
Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.
Σχετικοί εξωτερικοί σύνδεσμοι
Αναζήτηση στο google.com για παρόμοια θέματα
Εκπαιδευτικό υλικό από τον
Αθανάσιο Σταυρακούδη
σας παρέχετε κάτω από την άδεια
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.