Πίνακας απόλυτων και σχετικών συχνοτήτων

Τα δεδομένα αναφέρονται στο ερωτηματολόγιο που έχει συμπληρωθεί στο μάθημα. Εδώ η ανάλυση επικεντρώνονται στο ποσό (amount).

library(tidyverse)
library(readxl)

df <- read_excel("../data/survey-amount-height-tax-sleep.xlsx")

# Πίνακας απόλυτων συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(freq = n())

# Πίνακας σχετικών συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(freq = n() / nrow(.) ) 

# Πίνακας απόλυτων και σχετικών συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(
    freq_abs = n(),
    freq_rel = n() / nrow(.)
    ) 

# Πίνακας απόλυτων και ποσοστιαίων σχετικών συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(
    freq_abs = n(),
    freq_pct = 100*n() / nrow(.)
  ) 

# Πίνακας αθροιστικών συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(freq_abs = n()) %>% 
  mutate(freq_cum = cumsum( freq_abs))

# Πίνακας αθροιστικών σχετικών συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(freq_abs = n()) %>% 
  mutate(freq_cum = cumsum(freq_abs) / sum(freq_abs))

# Πίνακας ποσοστιαίων αθροιστικών σχετικών συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(freq_abs = n()) %>% 
  mutate(freq_cum_pct = 100*cumsum(freq_abs) / sum(freq_abs))


# Πίνακας όλων των συχνοτήτων
df %>% 
  group_by(amount) %>% 
  summarise(
    freq_abs = n(),
    freq_rel = n() / nrow(.),
    freq_pct = 100 * n() / nrow(.)
  ) %>% 
  mutate(
    freq_cum_abs = cumsum(freq_abs),
    freq_cum_rel = cumsum(freq_rel),
    freq_cum_pct = cumsum(freq_pct)
  )


## Διαγράμματα

boxplot(df$amount)
summary(df$amount)

# Πολύγωνο συχνοτήτων
df %>% 
  ggplot(aes(x = amount)) +
  geom_freqpoly(breaks = c(0, 10, 20, 50, 150))

# Ιστόγραμμα
df %>% 
  ggplot(aes(x = amount)) +
  geom_histogram(fill = "skyblue") +
  theme_minimal(base_size = 16)

df %>% 
  ggplot(aes(x = amount)) +
  geom_histogram(fill = "skyblue", binwidth = 20) +
  theme_minimal(base_size = 16)

df %>% 
  ggplot(aes(x = amount)) +
  geom_histogram(fill = "skyblue", breaks = c(0, 10, 20, 50, 150)) +
  scale_x_continuous(breaks = c(0, 10, 20, 50, 150)) +
  theme_minimal(base_size = 16)

# Ιστόγραμμα με πολύγωνο συχνοτήτων
df %>% 
  ggplot(aes(x = amount)) +
  geom_histogram(fill = "skyblue", breaks = seq(0, 150, by = 10)) +
  geom_freqpoly(color = "navyblue", size = 1, breaks = seq(0, 150, by = 10)) +
  scale_x_continuous(breaks = seq(0, 150, by = 10)) +
  theme_minimal(base_size = 16)


# Σχετική αθροιστική συχνότητα
df %>% 
  ggplot(aes(x = amount)) +
  stat_ecdf(color = "navyblue", geom = "step")  +
  scale_x_continuous(breaks = seq(0, 150, by = 10)) +
  theme_minimal(base_size = 16)
  
df %>% 
  ggplot(aes(x = amount)) +
  stat_ecdf(color = "navyblue", fill = "skyblue", geom = "area")  +
  scale_x_continuous(breaks = seq(0, 150, by = 10)) +
  theme_minimal(base_size = 16)

Επισυναπτόμενα αρχεία για μεταφόρτωση (download)

Συνδεθείτε για περισσότερες δυνατότητες αλληλεπίδρασης,
σχολιασμοί, εξωτερικοί σύνδεσμοι, βοήθεια, ψηφοφορίες, αρχεία, κτλ.

Creative Commons License
Εκπαιδευτικό υλικό από τον Αθανάσιο Σταυρακούδη σας παρέχετε κάτω από την άδεια Creative Commons Attribution-NonCommercial-ShareAlike 4.0 License.
Σας παρακαλώ να ενημερωθείτε για κάποιους επιπλέον περιορισμούς
http://stavrakoudis.econ.uoi.gr/stavrakoudis/?iid=401.