Επιλέγοντας υποσύνολα δεδομένων στην R

Έστω πως έχουμε ένα μεγάλο σύνολο δεδομένων. πως μπορούμε να επιλέξουμε ένα υποσύνολο από αυτά;

Για παράδειγμα, έστω ο παρακάτω πίνακας δεδομένων:

x1 <- sample(1:10, 50, replace=T)
x2 <- rnorm(50)
x  <- data.frame(x1, x2)
Μερικές ερωτήσεις-απαντήσεις:
  1. Να βρεθεί η στήλη x1 με τιμές μεγαλύτερες του 5
    subset(x, select=x1, x1>5)
    
  2. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
    subset(x, select=x2, x1>5)
    
  3. Να βρεθούν οι στήλες x1,x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
    subset(x, select=c(x1,x2), x1>5)
    
  4. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3
    subset(x, select=x2, x1==3)
    
  5. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3 ή 6
    subset(x, select=x2, x1==3 | x1==6)
    
  6. Να βρεθεί οι στήλες x1,x2 εκεί όπου η στήλη x2 έχει τιμές (45,50]
    subset(x, select=c(x1,x2), x2>45 & x2<=50)
    

Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.

Σχετικοί εξωτερικοί σύνδεσμοι

Αναζήτηση στο google.com για παρόμοια θέματα

Creative Commons License
Εκπαιδευτικό υλικό από τον Αθανάσιο Σταυρακούδη σας παρέχετε κάτω από την άδεια Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.

Αν επιθυμείτε μπορείτε να κάνετε μια δωρεά στον ιστότοπο