Εισαγωγή δεδομένων από αρχεία Excel και παραδείγματα περιγραφικής στατιστικής ανάλυσης με την R

Το βίντεο έχει διάρκεια 25:42. Πιθανά να χρειάζεται λίγος χρόνος για την προβολή του.


R Excel csv

Σημείωση: Η βιβλιοθήκη XLConnect δεν χρησιμοποιείται πλέον. Δείτε παρακάτω σχετικά με τη βιβλιοθήκη readxl για να διαβάσετε δεδομένα από αρχεία Excel. Όλα τα άλλα παραμένων ίδια.

Παραδείγματα ανάλυσης περιγραφικών στατιστικών από το κολεγιακό πρωτάθλημα καλαθοσφαίρισης των ΗΠΑ το 2013. Γίνεται επίσης επίδειξη της βιβλιοθήκης XLConnect για την άμεση εισαγωγή δεδομένων από αρχεία Excel (.xlsx) στην R.

# Εισαγωγή δεδομέων από αρχεία Excel ή csv
# https://www.spreadsheet-sports.com/2013-ncaa-mens-basketball-game-results-data/
# http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=514

library(XLConnect)
setwd("~/NCAA") # working directory, C:\NCAA in windows
getwd()

ncaa <- readWorksheetFromFile("NCAA2013.xlsx", sheet=1)
str(ncaa)
names(ncaa)

ncaa2 <-read.csv("NCAA2013.csv", sep=",", header=T)
ncaa3 <-read.csv("http://stavrakoudis.econ.uoi.gr/stavrakoudis/R/NCAA2013.csv", sep=",", header=T)

Gres <- ncaa3

str(Gres)
names(Gres)
head(Gres, 7)
tail(Gres, 4)
summary(Gres)

rm(ncaa, ncaa2, ncaa3)

Team     <- unique(Gres$Team)
Opponent <- unique(Gres$Opponent)

table(sort(Team) == sort(Opponent))

dif.Score         <- Gres$Team.Score - Gres$Opponent.Score
Gres["dif.Score"] <- Gres$Team.Score - Gres$Opponent.Score

names(Gres)

table(cut(Gres$dif.Score, c(-50, 0, 50)))
summary(Gres$dif.Score)
table(cut(Gres$dif.Score, c(min(Gres$dif.Score)-1, 0, max(Gres$dif.Score))))

sum.Score <- Gres$Team.Score + Gres$Opponent.Score
summary(sum.Score)
summary(Gres$Team.Score)
summary(Gres$Opponent.Score)

hist(sum.Score)
hist(dif.Score)
plot(dif.Score, sum.Score, cex=.2, col=2, xlim=c(-60,60), ylim=c(60,220))

Η βιβλιοθήκη readxl

Μια νεότερη βιβλιοθήκη (library) κκαι πολύ πιο αποτελεσματική στην ανάγνωση αρχείων είναι η readxl. Για να την εγκαταστήσετε δώστε την εντολή:

install.packages('readxl', dep=TRUE)

Για να μπορείτε να την χρησιμοποιήσετε, εφόσον την έχετε εγκαταστήσει, δώστε την εντολή:

library(readxl)

Μπορείτε στη συνέχεια να διαβάσετε τα δεδομένα από αρχείο Excel, όπως για παράδειγμα:

ncaa <- read_excel("NCAA2013.xlsx")

Ανάγνωση δεδομένων CSV από την ιστοσελίδα αυτή

Για να περάσετε απευθείας στην ανάλυση δεδομένων χωρίς να χρειάζεται να κατεβάσετε αρχεία, μπορείτε να εκτελέσετε την παρακάτω εντολή:

read.csv("http://stavrakoudis.econ.uoi.gr/stavrakoudis/R/NCAA2013.csv")

Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.

Creative Commons License
Εκπαιδευτικό υλικό από τον Αθανάσιο Σταυρακούδη σας παρέχετε κάτω από την άδεια Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.