Και άλλες διακριτές κατανομές
Εργαστήριο Εφαρμογών Πληροφορικής και Υπολογιστικών Οικονομικών
05/12/2023
Τυχαία μεταβλητή είναι μια αβέβαιη ποσότητα η τιμή της οποίας είναι τυχαία
Έστω πως πραγματοποιούμε το πείραμα ρίψης ενός κέρματος και παρατηρούμε την πλευρά του κέρματος. Αυθαίρετα θεωρούμε πως επιτυχία είναι να φέρουμε κεφαλή (κουκουβάγια).
Ρίψη | Επιτυχία | Πιθανότητα |
---|---|---|
\(X=0\) | \(P(X=0) = 1/2\) | |
\(X=1\) | \(P(X=1) = 1/2\) |
Κατανομή πιθανότητας
Υπάρχουν δύο δυνατά ενδεχόμενα (\(X\)), Κ(εφαλή) και Γ(γράμματα). Κάθε ενδεδχόμενο μπορεί να συμβεί με συγκεκριμένη πιθανότητα, εδώ ίση με 1/2. Οι τιμές που παίρνει η πιθανότητα (\(P(X)\)) εμφάνισης κάθε ενδεχομένου προέρχεται από την κατανομή πιθανότητας.
Δειγματικός χώρος
Μια τυχαία μεταβλητή είναι συνάρτηση του δειγματικού χώρου. Στο συγκεκριμένο παράδειγμα ο δειγματικός χώρος είναι το σύνολο \(\Omega = \{Γ, Κ\}\) το οποίο αυθαίρετα ορίζουμε ως \(\Omega = \{0, 1\}\).
Ρίψη | Επιτυχία | Πιθανότητα |
---|---|---|
\(X=0\) | \(P(X=0) = 1/4\) | |
\(X=1\) | \(P(X=1) = 2/4\) | |
\(X=2\) | \(P(X=2) = 1/4\) |
\(\Omega = \{0, 1, 2\}\)
Ρίψη | Επιτυχία | Πιθανότητα |
---|---|---|
\(X=0\) | \(P(X=0) = 1/8\) | |
\(X=1\) | \(P(X=1) = 3/8\) | |
\(X=2\) | \(P(X=1) = 3/8\) | |
X=3 | P(X=3) = 1/8 |
\(\Omega = \{000, 001, 010, 100, 011, 101, 110, 111\}\)
Ας υποθέσουμε πως ρίχνουμε ένα ζάρι. Κάθε πιθανό αποτέλεσμα (1 έως 6) έχει πιθανότητα ίση με 1/6 (αμερόληπτο ζάρι).
Να πως μπορούμε να κάνουμε προσομοίωση ρίψης ενός ζαριού:
Στο παραπάνω ## Ένας τυχαίο ενδεχόμενο
Αντί να ρίξουμε κέρμα (πείραμα Κεφαλή/Γράμματα) ας ζητήσουμε από τον υπολογιστή έναν τυχαίο αριθμό 0 (επιτυχία) ή 1 (αποτυχία) με πιθανότητα \(p = 1/2\)
Η διαδικασία ονομάζεται προσομοίωση: υποκαθιστούμε μια φυσική διαδικασία με μια νοητή, και μάλιστα μέσω Η/Υ (υπολογιστική προσομοίωση)
Ας υποθέσουμε τώρα πως ρίχνουμε 10 κέρματα:
Αν θέλουμε μάλιστα μπορούμε να υπολογίσουμε και το πόσες φορές είχαμε επιτυχία:
Ας υποθέσουμε τώρα πως ρίχνουμε 10 κέρματα από 5 φορές το καθένα:
Πως το ερμηνεύουμε:
Ας υποθέσουμε πως καλείτε μέσα στο διάστημα μιας εβδομάδας 8 φίλους σας από 7 φορές τον καθένα (μία φορά κάθε μέρα). Αν η πιθανότητα να απαντήσει κάποιος σε μία κλήση είναι \(p = \frac{3}{4}\), τότε μια τυχαία εβδομάδα θα μπορούσατε να είχατε τα παρακάτω αποτελέσματα:
Παρατηρήσεις:
Η συνάρτηση dbinom υπολογίζει την πυκνότητα πιθανότητας της διωνυμικής κατανομής, την πιθανότητα σε κάποιο \(X=k\).
\[ \Pr(k;n,p) = \Pr(X = k) = \binom{n}{k} p^k(1-p)^{n-k} \]
\[ \binom{n}{k} =\frac{n!}{k!(n-k)!} \]
Στην R γράφουμε:
Επιτυχία: \[\Pr(X=1) = \binom{2}{1}\left(\frac{1}{2}\right)^1\left(1-\frac{1}{2}\right)^{(2-1)} = \frac{2!}{1!(2-1)!}\times\frac{1}{2}\times\frac{1}{2} = \frac{1}{2}\]
Αποτυχία: \[\Pr(X=0) = \binom{2}{1}\left(\frac{1}{2}\right)^1\left(1-\frac{1}{2}\right)^{(2-1)} = \frac{2!}{1!(2-1)!}\times\frac{1}{2}\times\frac{1}{2} = \frac{1}{2}\]
Αν ρίξουμε 1 φορά (\(n\)=size=1) 1 κέρμα έχουμε ενδεχόμενα είτε:
Μπορούμε να συντομεύσουμε τους υπολογισμούς ως εξής:
Ας υποθέσουμε πως κάνουμε ένα πείραμα με δύο πιθανά ενδεχόμενα (ρίψη κέρματος). Αναπαριστούμε τα αποτελέσματα με 0 (αποτυχία) και 1 (επιτυχία). Αν κάνουμε δύο πειράματα (2 ρίψεις) ποια είναι τα πιθανά αποτελέσματα;
Να πώς μπορούμε να το δούμε αυτό στην R:
Δοκιμάστε τα παρακάτω και σχολιάστε το αποτέλεσμα:
Πιθανά ενδεχόμενα με δύο ρίψεις:
k n p
1 0 1 0.25
2 1 2 0.50
3 2 1 0.25
Παρατηρήσεις:
Δύο ρίψεις με πιθανότητα επιτυχίας 1/2
Ακόμα καλύτερα μπορούμε να δώσουμε μια πιο γενική λύση
ή ακόμα καλύτερα:
Ακόμα καλύτερα μπορούμε να δώσουμε μια πιο γενική λύση
n <- 3
k <- 0:n
d <- dbinom(x = k, size = n, prob = 0.5)
df <- tibble(k, d)
ggplot(df, aes(x = k, y = d)) +
geom_segment(x = k, y = 0, xend = k, yend = d, size = 1) +
geom_point(size = 6) +
scale_x_continuous(breaks = 0:n) +
scale_y_continuous(limits = c(0, NA)) +
labs(x = "", y = "") +
theme_cowplot(font_size = 28)
Προσοχή! Η πιθανότητα επιτυχίας δεν είναι παντού και πάντα 50%.
Αν για παράδειγμα σε ένα τυχαία πείραμα τριών επαναλήψεων η πιθανότητα επιτυχίας είναι 40%, τότε θα έχουμε:
Ας υποθέσουμε πως δίνουμε ένα τεστ 10 ερωτήσεων πολλαπλής επιλογής όπου κάθε ερώτημα έχει 4 πιθανές απαντήσεις. Ποια είναι η πιθανότητα (απαντώντας στην τύχη κάθε ερώτημα) να πετύχουμε σκορ 0 έως 10;
Οι τιμές και οι πιθανότητες που μπορεί να πάρει μια διακριτή μεταβλητή δίνονται στον παρακάτω πίνακα.
Ποια είναι η αναμενόμενη (μέση) τιμή;
x | P | xP |
---|---|---|
0 | 0.125 | 0.000 |
1 | 0.375 | 0.375 |
2 | 0.375 | 0.750 |
3 | 0.125 | 0.375 |
NA | NA | 1.500 |
\[E[h(X)] = \sum_{i=1}{N}h(x)P(x)\]
Ρίχνουμε ένα κέρμα 4 φορές. Ποια είναι η πιθανότητα να έχουμε επιτυχία τουλάχιστον 3 φορές;
Απάντηση: 0.25 + 0.0625 = 0.3125
\[\Pr(X=3) = \binom{4}{3}\left(\dfrac{1}{2}\right)^3\left(1-\dfrac{1}{2}\right)^1 = \dfrac{4!}{3!\times1!}\left(\dfrac{1}{2}\right)^3\left(1-\dfrac{1}{2}\right)^1 = 4\times\dfrac{1}{8}\times\dfrac{1}{2} = \dfrac{1}{4}\]
\[\Pr(X=4) = \binom{4}{4}\left(\dfrac{1}{2}\right)^4\left(1-\dfrac{1}{2}\right)^0 = \dfrac{4!}{4!\times0!}\left(\dfrac{1}{2}\right)^4\left(1-\dfrac{1}{2}\right)^0 = 1\times\dfrac{1}{16}\times\dfrac{1}{1} = \dfrac{1}{16}\]
\[\Pr(X\ge3) = \Pr(X=3) + \Pr(X=4) = \dfrac{1}{4}+\dfrac{1}{16} = \dfrac{5}{16}\]
Κάθε περίπτωση χωριστά:
Συνολικά:
Αυτό που ζητάμε είναι το άθροισμα:
Κόκκινη περιοχή
Μπλε περιοχή
Σε ένα πολυκατάστημα μια εξειδικευμένη πωλήτρια προσπαθεί να πουλήσει ένα νέο προϊόν. Η πιθανότητα επιτυχίας της (μετά από κάθε επίδειξη σε πελάτη) είναι 20%.
Αν σε μια ημέρα δει 10 πελάτες, ποια είναι η πιθανότητα να πουλήσει το προϊόν σε 2 από αυτούς;
\[\Pr(X=2) = \binom{10}{2}\left(\dfrac{1}{5}\right)^2\left(1-\dfrac{1}{5}\right)^8 = \dfrac{10!}{8!\times2!}\left(\dfrac{1}{5}\right)^2\left(1-\dfrac{1}{5}\right)^8 = 45\times\dfrac{1}{25}\times\dfrac{65536}{390625} \approx 0.3019899 \]
Οι 3 τρόποι που δίνονται παρακάτω είναι ισοδύναμοι και δίνουν το ίδιο αποτέλεσμα.
Ρίχνουμε ένα ζάρι 20 φορές. Υποθέτουμε πως επιτυχία είναι να φέρουμε 5 ή 6.
# A tibble: 21 × 3
k d cp
<int> <dbl> <dbl>
1 0 0.000301 0.000301
2 1 0.00301 0.00331
3 2 0.0143 0.0176
4 3 0.0429 0.0604
5 4 0.0911 0.152
6 5 0.146 0.297
7 6 0.182 0.479
8 7 0.182 0.661
9 8 0.148 0.809
10 9 0.0987 0.908
# ℹ 11 more rows
Ποιο είναι το ελάχιστο πλήθος προσπαθειών έτσι ώστε να είμαστε τουλάχιστον 80% σίγουροι για 1 επιτυχία;
Έχει ιδιαίτερη σύνδεση με την διωνυμική κατανομή.
Αναλύει το ερώτημα: Πόσες προσπάθειες μέχρι την πρώτη επιτυχία.
Παράδειγμα προς ανάλυση:
\[p = 0.25\]
Ποια είναι η πιθανότητα να προσληφθούμε με την 1η αίτηση;
Γιατί \(n=0\); Γιατί ζητάμε επιτυχία με την 1η αίτηση, δηλαδή 0 αποτυχίες.
Ποια είναι η πιθανότητα να προσληφθούμε με την 2η αίτηση;
Δηλαδή 1 αποτυχία και μετά επιτυχία.
Ποια είναι η πιθανότητα να προσληφθούμε με την 1η ή 2η αίτηση;
Δηλαδή επιτυχία μετά από καμία ή το πολύ 1 επιτυχία.
Πόσες αιτήσεις πρέπει να κάνουμε για να αυξηθεί το ποσοστό πιθανότητας πρόσληψης στο 95%;
11 αιτήσεις
Αθανάσιος Σταυρακούδης - ΕΕΠΥΟ