Εισαγωγή δεδομένων από αρχεία Excel και παραδείγματα περιγραφικής στατιστικής ανάλυσης με την R

Το βίντεο έχει διάρκεια 25:42. Πιθανά να χρειάζεται λίγος χρόνος για την προβολή του.


R Excel csv

Σημείωση: Η βιβλιοθήκη XLConnect δεν χρησιμοποιείται πλέον. Δείτε παρακάτω σχετικά με τη βιβλιοθήκη readxl για να διαβάσετε δεδομένα από αρχεία Excel. Όλα τα άλλα παραμένων ίδια.

Παραδείγματα ανάλυσης περιγραφικών στατιστικών από το κολεγιακό πρωτάθλημα καλαθοσφαίρισης των ΗΠΑ το 2013. Γίνεται επίσης επίδειξη της βιβλιοθήκης XLConnect για την άμεση εισαγωγή δεδομένων από αρχεία Excel (.xlsx) στην R.

# Εισαγωγή δεδομέων από αρχεία Excel ή csv
# https://www.spreadsheet-sports.com/2013-ncaa-mens-basketball-game-results-data/
# http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=514

library(XLConnect)
setwd("~/NCAA") # working directory, C:\NCAA in windows
getwd()

ncaa <- readWorksheetFromFile("NCAA2013.xlsx", sheet=1)
str(ncaa)
names(ncaa)

ncaa2 <-read.csv("NCAA2013.csv", sep=",", header=T)
ncaa3 <-read.csv("http://stavrakoudis.econ.uoi.gr/stavrakoudis/R/NCAA2013.csv", sep=",", header=T)

Gres <- ncaa2
Gres <- ncaa[,2:5] 

str(Gres)
names(Gres)
head(Gres, 7)
tail(Gres, 4)
summary(Gres)

rm(ncaa, ncaa2, ncaa3)

Team     <- unique(Gres$Team)
Opponent <- unique(Gres$Opponent)

table(sort(Team) == sort(Opponent))

dif.Score         <- Gres$Team.Score - Gres$Opponent.Score
Gres["dif.Score"] <- Gres$Team.Score - Gres$Opponent.Score

names(Gres)

table(cut(Gres$dif.Score, c(-50, 0, 50)))
summary(Gres$dif.Score)
table(cut(Gres$dif.Score, c(min(Gres$dif.Score)-1, 0, max(Gres$dif.Score))))

sum.Score <- Gres$Team.Score + Gres$Opponent.Score
summary(sum.Score)
summary(Gres$Team.Score)
summary(Gres$Opponent.Score)

hist(sum.Score)
hist(dif.Score)
plot(dif.Score, sum.Score, cex=.2, col=2, xlim=c(-60,60), ylim=c(60,220))

Η βιβλιοθήκη readxl

Μια νεότερη βιβλιοθήκη (library) κκαι πολύ πιο αποτελεσματική στην ανάγνωση αρχείων είναι η readxl. Για να την εγκαταστήσετε δώστε την εντολή:

install.packages('readxl', dep=TRUE)

Για να μπορείτε να την χρησιμοποιήσετε, εφόσον την έχετε εγκαταστήσει, δώστε την εντολή:

library(readxl)

Μπορείτε στη συνέχεια να διαβάσετε τα δεδομένα από αρχείο Excel, όπως για παράδειγμα:

ncaa <- read_excel("NCAA2013.xlsx")

Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.

Creative Commons License
Εκπαιδευτικό υλικό από τον Αθανάσιο Σταυρακούδη σας παρέχετε κάτω από την άδεια Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.