Επιλέγοντας υποσύνολα δεδομένων στην R

Έστω πως έχουμε ένα μεγάλο σύνολο δεδομένων. πως μπορούμε να επιλέξουμε ένα υποσύνολο από αυτά;

Για παράδειγμα, έστω ο παρακάτω πίνακας δεδομένων:

x1 <- sample(1:10, 50, replace=T)
x2 <- rnorm(50)
x  <- data.frame(x1, x2)
Μερικές ερωτήσεις-απαντήσεις:
  1. Να βρεθεί η στήλη x1 με τιμές μεγαλύτερες του 5
    subset(x, select=x1, x1>5)
    
  2. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
    subset(x, select=x2, x1>5)
    
  3. Να βρεθούν οι στήλες x1,x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
    subset(x, select=c(x1,x2), x1>5)
    
  4. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3
    subset(x, select=x2, x1==3)
    
  5. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3 ή 6
    subset(x, select=x2, x1==3 | x1==6)
    
  6. Να βρεθεί οι στήλες x1,x2 εκεί όπου η στήλη x2 έχει τιμές (45,50]
    subset(x, select=c(x1,x2), x2>45 & x2<=50)
    

Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.

Creative Commons License
Εκπαιδευτικό υλικό από τον Αθανάσιο Σταυρακούδη σας παρέχετε κάτω από την άδεια Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.