Επιλέγοντας υποσύνολα δεδομένων στην R

Έστω πως έχουμε ένα μεγάλο σύνολο δεδομένων. πως μπορούμε να επιλέξουμε ένα υποσύνολο από αυτά;

Για παράδειγμα, έστω ο παρακάτω πίνακας δεδομένων:

x1 <- sample(1:10, 50, replace=T)
x2 <- rnorm(50)
x <- data.frame(x1, x2)
Μερικές ερωτήσεις-απαντήσεις:
 1. Να βρεθεί η στήλη x1 με τιμές μεγαλύτερες του 5
  subset(x, select=x1, x1>5)
  
 2. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
  subset(x, select=x2, x1>5)
  
 3. Να βρεθούν οι στήλες x1,x2 εκεί όπου η στήλη x1 έχει τιμές μεγαλύτερες του 5
  subset(x, select=c(x1,x2), x1>5)
  
 4. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3
  subset(x, select=x2, x1==3)
  
 5. Να βρεθεί η στήλη x2 εκεί όπου η στήλη x1 έχει τιμή 3 ή 6
  subset(x, select=x2, x1==3 | x1==6)
  
 6. Να βρεθεί οι στήλες x1,x2 εκεί όπου η στήλη x2 έχει τιμές (45,50]
  subset(x, select=c(x1,x2), x2>45 & x2<=50)
  

Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.

Creative Commons License
Εκπαιδευτικό υλικό από τον Αθανάσιο Σταυρακούδη σας παρέχετε κάτω από την άδεια Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.