Verteilungsfunktion
In diesem Kapitel schauen wir uns an, was die Verteilungsfunktion (Kumulative Verteilungsfunktion) ist.
Erforderliches Vorwissen
Einsatzzweck
Die Verteilungsfunktion ist ein Hilfsmittel zur Beschreibung einer diskreten oder stetigen Wahrscheinlichkeitsverteilung.
Definition
Die Verteilungsfunktion ist eine Funktion, also eine Beziehung zwischen zwei Mengen, die jedem Element der einen Menge genau ein Element der anderen Menge zuordnet.
Eine Funktion $F$
, die
jedem $x$
einer Zufallsvariable $X$
genau eine Wahrscheinlichkeit $P(X \le x)$
zuordnet, heißt Verteilungsfunktion.
Kurzschreibweise: $F\colon x \to P(X \le x)$
Diskrete Verteilungsfunktion
Eine Zufallsvariable ordnet
jedem $\omega_i$
aus $\Omega$
genau ein $x_i$
aus $\mathbb{R}$
zu.
Eine Wahrscheinlichkeitsfunktion ordnet
jedem $x_i$
aus $\mathbb{R}$
genau ein $P(X = x_i)$
aus $[0;1]$
zu.
Eine Verteilungsfunktion ordnet
jedem $x_i$
aus $\mathbb{R}$
genau ein $P(X \le x_i)$
aus $[0;1]$
zu.
Der Vollständigkeit halber schauen wir uns die wichtigsten Zusammenhänge im Vergleich an:
Zufallsvariable $\boldsymbol{X}$ | Wahrscheinlichkeitsfunktion $\boldsymbol{f}$ | Verteilungsfunktion $\boldsymbol{F}$ |
---|---|---|
$X\colon \Omega \to \mathbb{R}$ | $f\colon \mathbb{R} \to [0;1]$ | $F\colon \mathbb{R} \to [0;1]$ |
$X\colon \omega \to X(\omega)$ | $f\colon x \to f(x)$ | $F\colon x \to F(x)$ |
$X(\omega) = x$ | $f(x) = P(X = x)$ | $F(x) = P(X \le x)$ |
Die Verteilungsfunktion ordnet jedem $x$
eine Wahrscheinlichkeit $P(X \le x)$
zu.
$\boldsymbol{P(X \le x)}$
gibt die Wahrscheinlichkeit dafür an, dass die Zufallsvariable $X$
höchstens den Wert $x$
annimmt.
Die bisherigen Ausführungen waren ziemlich theoretisch. Es wird Zeit für ein Beispiel…
Beispiel
Wir werfen eine Münze zweimal hintereinander.
Wenn 2x $\text{ZAHL}$
fällt, verlieren wir 2 Euro.
Wenn 1x $\text{KOPF}$
fällt, gewinnen wir 1 Euro.
Wenn 2x $\text{KOPF}$
fällt, gewinnen wir 2 Euro.
Zufallsvariable: $\boldsymbol{\omega \to x}$
Die Zufallsvariable ordnet jedem Ergebnis $\omega$
seinen Gewinn $x$
zu.
a) Darstellung als Wertetabelle
$$ \begin{array}{r|r|r|r|r} \text{Ergebnis } \omega_i & ZZ & ZK & KZ & KK \\ \hline \text{Gewinn } x_i & -2 & 1 & 1 & 2 \end{array} $$
b) Darstellung als abschnittsweise definierte Funktion
$$ \begin{equation*} X(\omega) = \begin{cases} -2 & \text{für } \omega = ZZ \\[5px] 1 & \text{für } \omega = ZK \\[5px] 1 & \text{für } \omega = KZ \\[5px] 2 & \text{für } \omega = KK \end{cases} \end{equation*} $$
c) Darstellung als Mengendiagramm
Wahrscheinlichkeitsfunktion: $\boldsymbol{x \to P(X = x)}$
Die Wahrscheinlichkeitsfunktion ordnet jedem Gewinn $x$
seine Wahrscheinlichkeit zu.
Nebenrechnung
$$ \Omega = \{ZZ,ZK,KZ,KK\} $$
$$ |\Omega| = 4 $$
Wahrscheinlichkeit für $X = -2$
$$ E_1(X = -2) = \{ZZ\} \quad \Rightarrow |E_1| = 1 $$
$$ P(X = -2) = \frac{|E_1|}{|\Omega|} = \frac{1}{4} = 0{,}25 $$
Wahrscheinlichkeit für $X = 1$
$$ E_2(X = 1) = \{ZK,KZ\} \quad \Rightarrow |E_2| = 2 $$
$$ P(X = 1) = \frac{|E_2|}{|\Omega|} = \frac{2}{4} = 0{,}5 $$
Wahrscheinlichkeit für $X = 2$
$$ E_3(X = 2) = \{KK\} \quad \Rightarrow |E_3| = 1 $$
$$ P(X = 2) = \frac{|E_3|}{|\Omega|} = \frac{1}{4} = 0{,}25 $$
a) Darstellung als Wertetabelle
$$ \begin{array}{r|r|r|r} \text{Gewinn } x_i & -2 & 1 & 2\\ \hline f(x_i) = P(X = x_i) & 0{,}25 & 0{,}5 & 0{,}25 \end{array} $$
b) Darstellung als abschnittsweise definierte Funktion
$$ \begin{equation*} f(x_i) = P(X = x_i) = \begin{cases} 0{,}25 & \text{für } x = -2 \\[5px] 0{,}5 & \text{für } x = 1 \\[5px] 0{,}25 & \text{für } x = 2 \\[5px] 0 & \text{sonst} \end{cases} \end{equation*} $$
c) Darstellung als Mengendiagramm
Verteilungsfunktion: $\boldsymbol{x \to P(X \le x)}$
Die Verteilungsfunktion ordnet jedem Gewinn $x$
seine kumulierte Wahrscheinlichkeit zu.
$$ F(x) = P(X \le x) = \sum_{x_i \le x} P(X = x_i) $$
Die Wahrscheinlichkeit dafür, dass die Zufallsgröße $X$
kleiner gleich $x$
ist, entspricht der Summe aller Einzelwahrscheinlichkeiten $x_i$
,
solange $x_i$
kleiner gleich $x$
ist.
Nebenrechnung
Wahrscheinlichkeit für $X \le -2$
$$ \begin{align*} P(X \le -2) &= P(X = -2) \\[5px] &= 0{,}25 \end{align*} $$
Wahrscheinlichkeit für $X \le 1$
$$ \begin{align*} P(X \le 1) &= P(X = -2) + P(X = 1) \\[5px] &= 0{,}25 + 0{,}5 \\[5px] &= 0{,}75 \end{align*} $$
Wahrscheinlichkeit für $X \le 2$
$$ \begin{align*} P(X \le 2) &= P(X = -2) + P(X = 1) + P(X = 2) \\[5px] &= 0{,}25 + 0{,}5 + 0{,}25 \\[5px] &= 1 \end{align*} $$
a) Darstellung als Wertetabelle
$$ \begin{array}{r|c|c|c|c} \text{Gewinn } x_i \in & ]-\infty;-2[ & [-2;1[ & [1;2[ & [2;\infty[ \\ \hline F(x_i) = P(X \le x_i) & 0 & 0{,}25 & 0{,}75 & 1 \end{array} $$
b) Darstellung als abschnittsweise definierte Funktion
$$ \begin{equation*} F(x_i) = P(X \le x_i) = \begin{cases} 0 & \text{für } x < -2 \\[5px] 0{,}25 & \text{für } -2 \le x < 1 \\[5px] 0{,}75 & \text{für } 1 \le x < 2 \\[5px] 1 & \text{für } x \ge 2 \end{cases} \end{equation*} $$
c) Darstellung als Mengendiagramm
Wahrscheinlichkeiten berechnen
$$ P(X \le a) = F(a) $$
$$ P(X < a) = F(a) - P(X = a) $$
$$ P(X > a) = 1 - F(a) $$
$$ P(X \geq a) = 1 - F(a) + P(X = a) $$
$$ P(a < X \le b) = F(b) - F(a) $$
$$ P(a \le X \le b) = F(b) - F(a) + P(X = a) $$
$$ P(a < X < b) = F(b) - F(a) - P(X = b) $$
$$ P(a \le X < b) = F(b) - F(a) + P(X = a) - P(X = b) $$
Aufgabenstellung
$$ \begin{equation*} F(x_i) = P(X \le x_i) = \begin{cases} 0 & \text{für } x < -2 \\[5px] 0{,}25 & \text{für } -2 \le x < 1 \\[5px] 0{,}75 & \text{für } 1 \le x < 2 \\[5px] 1 & \text{für } x \ge 2 \end{cases} \end{equation*} $$
Mit welcher Wahrscheinlichkeit macht man höchstens 1 € Gewinn?
$$ \begin{align*} P(X \le 1) &= F(1) \\[5px] &= 0{,}75 \\[5px] &= 75\ \% \end{align*} $$
Mit welcher Wahrscheinlichkeit macht man mehr als 1 € und höchstens 2 € Gewinn?
$$ \begin{align*} P(1 < X \le 2) &= P(X \le 2) - P(X \le 1) \\[5px] &= F(2) - F(1) \\[5px] &= 1 - 0{,}75 \\[5px] &= 0{,}25 \\[5px] &= 25\ \% \end{align*} $$
Mit welcher Wahrscheinlichkeit man mehr als -2 € Gewinn?
$$ \begin{align*} P(X > - 2) &= 1 - P(X \le -2) \\[5px] &= 1 - F(-2) \\[5px] &= 1 - 0{,}25 \\[5px] &= 0{,}75 \\[5px] &= 75\ \% \end{align*} $$
$$ P(X = x_i) = F(x_i) - F(x_{i-1}) $$
Mit welcher Wahrscheinlichkeit gewinnt man genau 1 €?
$$ \begin{align*} P(X = 1) &= P(X \le 1) - P(X \le -2) \\[5px] &= F(1) - F(-2) \\[5px] &= 0{,}75 - 0{,}25 \\[5px] &= 0{,}5 \\[5px] &= 50\ \% \end{align*} $$
Graph
Die Verteilungsfunktion $F$
einer diskreten Zufallsgröße $X$
ist eine Treppenfunktion.
$$ \begin{equation*} F(x_i) = P(X \le x_i) = \begin{cases} 0 & \text{für } x < -2 \\[5px] 0{,}25 & \text{für } -2 \le x < 1 \\[5px] 0{,}75 & \text{für } 1 \le x < 2 \\[5px] 1 & \text{für } x \ge 2 \end{cases} \end{equation*} $$
Die Verteilungsfunktion $F$
hat an den Stellen $x = x_i$
eine Sprungstelle:
Rote Punkte gehören zum Graphen der Funktion, weiße Punkte dagegen nicht.
Die roten Punkte werden oft weggelassen.
Merke: Die Höhe des Sprungs von $F(x)$
im Punkt $x_i$
entspricht $P(X = x_i)$
.
Eigenschaften einer Verteilungsfunktion
$F(x)$
ist monoton steigend.$F(x)$
ist rechtsseitig stetig.$\lim_{x\to -\infty} F(x) = 0$
und$\lim_{x\to +\infty} F(x) = 1$
Jede Verteilungsfunktion besitzt höchstens abzählbar viele Sprungstellen.
Stetige Verteilungsfunktion
Bei diskreten Zufallsvariablen können wir zwischen der Wahrscheinlichkeitsfunktion und der Verteilungsfunktion wählen, wenn man Wahrscheinlichkeiten berechnen will.
Bei stetigen Zufallsvariablen verwendet man zur Berechnung von Wahrscheinlichkeiten immer die entsprechende Verteilungsfunktion. Sie ergibt sich aus der Integration der Dichtefunktion:
$$ F(x) = P(X \le x) = \int_{-\infty}^{x} \! f(u) \, \textrm{d}u $$
Daraus lässt sich eine wichtige Eigenschaft ableiten:
$$ P(X = x) = 0 $$
In Worten: Die Wahrscheinlichkeit, dass eine stetige Zufallsvariable $X$
einen bestimmten Wert $x$
annimmt, ist stets Null.
Grund dafür ist, dass die Fläche über einem Punkt $x$
gleich Null ist:
$$ P(X = x) = \int_{x}^{x} \! f(u) \, \textrm{d}u = F(x) - F(x) = 0 $$
Aus dieser Eigenschaft folgt
$$ \Rightarrow \quad P(X \le a) = P(X < a) = F(a) $$
$$ \Rightarrow \quad P(a \le X \le b) = P(a < X < b) = P(a \le X < b) = P(a < X \le b) = F(b) - F(a) $$
$$ \Rightarrow \quad P(X > a) = P(X \geq a) = 1 - P(X < a) = 1 - P(X \le a) = 1 - F(a) $$
Zusammenhang zwischen Dichtefunktion und Verteilungsfunktion
$$ P(X \le 3) = \int_{-\infty}^{3} \! f(u) \, \textrm{d}u $$
Die Wahrscheinlichkeit $P(X \le 3)$
ist gleich der Fläche zwischen
der Dichtefunktion $f$
, der $x$
-Achse und
der senkrechten Gerade $x = 3$
.
$$ P(X \le 3) = F(3) $$
Die Wahrscheinlichkeit $P(X \le 3)$
entspricht dem Funktionswert der Verteilungsfunktion an der Stelle $x = 3$
.
$$ P(2 < X \le 3) = \int_{2}^{3} \! f(u) \, \textrm{d}u $$
Die Wahrscheinlichkeit $P(2 < X \le 3)$
ist gleich der Fläche zwischen
der Dichtefunktion $f$
, der $x$
-Achse und
den beiden senkrechten Geraden
bei $x = 2$
und $x = 3$
.
$$ P(2 < X \le 3) = F(3) - F(2) $$
Die Wahrscheinlichkeit $P(2 < X \le 3)$
entspricht dem Funktionswert der Verteilungsfunktion an der Stelle $x = 3$
abzüglich des Funktionswerts der Verteilungsfunktion an der Stelle $x = 2$
.
$$ P(X > 4) = \int_{4}^{\infty} \! f(u) \, \textrm{d}u $$
Die Wahrscheinlichkeit $P(X \le 3)$
ist gleich der Fläche zwischen
der senkrechten Gerade $x = 4$
der Dichtefunktion $f$
und der $x$
-Achse.
$$ P(X > 4) = 1 - F(4) $$
Die Wahrscheinlichkeit $P(X > 4)$
entspricht 1 abzüglich des Funktionswerts der Verteilungsfunktion an der Stelle $x = 4$
.
Falls du die Gleichung $P(X > 4) = 1 - F(4)$
nicht verstehst, mach dir Folgendes klar:
$P(X > 4)$
ist dasselbe wie $P(4 < X < \infty)$
$$ P(4 < X < \infty) = F(\infty) - F(4) $$
$$ F(\infty) = \int_{-\infty}^{\infty} \! f(x) \, \textrm{d}x = 1 $$
In Worten: Die Fläche unter der Dichtefunktion hat den Inhalt $1$
.
Beispiel
Ein Zufallsgenerator erzeugt zufällig eine Zahl zwischen 2 und 4.
Gegeben ist die Dichtefunktion
$$ \begin{equation*} f(x) = \begin{cases} 0 & \text{für } x < 2 \\[5px] \frac{1}{2} & \text{für } 2 \le x \le 4 \\[5px] 0 & \text{für } x > 4 \end{cases} \end{equation*} $$
Berechne die Verteilungsfunktion.
1. Intervall: $\boldsymbol{x < 2}$
$$ \begin{align*} F(x) &= \int_{-\infty}^{x} \! f(u) \, \textrm{d}u \\[5px] &= \int_{-\infty}^{x} \! 0 \, \textrm{d}u \\[5px] &= 0 \end{align*} $$
2. Intervall $\boldsymbol{2 \le x \le 4}$
$$ \begin{align*} F(x) &= \int_{-\infty}^{x} \! f(u) \, \textrm{d}u \\[5px] &= \int_{-\infty}^{2} \! 0 \, \textrm{d}u + \int_{2}^{x} \! \frac{1}{2} \, \textrm{d}u \\[5px] &= 0 + \left[\frac{1}{2}u\right]_{2}^{x} \\[5px] &= \frac{1}{2} \cdot x - \frac{1}{2} \cdot 2 \\[5px] &= \frac{1}{2}x - 1 \end{align*} $$
3. Intervall: $\boldsymbol{x > 4}$
$$ F(x) = 1 $$
Zusammenfassung
$$ \begin{equation*} F(x) = \begin{cases} 0 & \text{für } x < 2 \\[5px] \frac{1}{2}x - 1 & \text{für } 2 \le x \le 4 \\[5px] 1 & \text{für } x > 4 \end{cases} \end{equation*} $$
Wahrscheinlichkeiten berechnen
$$ P(X \le a) = F(a) $$
$$ P(a < X \le b) = F(b) - F(a) $$
$$ P(X > a) = 1 - F(a) $$
Für stetige Zufallsvariablen gilt außerdem:
$$ P(X \le a) = P(X < a) $$
$$ P(a < X \le b) = P(a < X < b) = P(a \le X < b) = P(a < X \le b) $$
$$ P(X > a) = P(X \geq a) = 1 - P(X < a) = 1 - P(X \le a) $$
Ob die Intervallgrenzen zum Intervall gehören oder nicht, spielt keine Rolle.
Aufgabenstellung
$$ \begin{equation*} F(x) = \begin{cases} 0 & \text{für } x < 2 \\[5px] \frac{1}{2}x - 1 & \text{für } 2 \le x \le 4 \\[5px] 1 & \text{für } x > 4 \end{cases} \end{equation*} $$
Mit welcher Wahrscheinlichkeit ist $X$
kleiner als 2,5?
$$ \begin{align*} P(X < 2{,}5) &= F(2{,}5) \\[5px] &= \frac{1}{2} \cdot 2{,}5 - 1 \\[5px] &= 0{,}25 \\[5px] &= 25\ \% \end{align*} $$
Mit welcher Wahrscheinlichkeit ist $X$
zwischen 3,2 und 3,4?
$$ \begin{align*} P(3{,}2 < X < 3{,}4) &= F(3{,}4) - F(3{,}2) \\[5px] &= \frac{1}{2} \cdot 3{,}4 - 1 - \left(\frac{1}{2} \cdot 3{,}2 - 1\right) \\[5px] &= 0{,}7 - 0{,}6 \\[5px] &= 0{,}1 \\[5px] &= 10\ \% \end{align*} $$
Mit welcher Wahrscheinlichkeit ist $X$
größer als 3,7?
$$ \begin{align*} P(X > 3{,}7) &= 1 - P(X \le 3{,}7) \\[5px] &= 1 - F(3{,}7) \\[5px] &= 1 - \left(\frac{1}{2} \cdot 3{,}7 - 1\right) \\[5px] &= 1 - 0{,}85 \\[5px] &= 0{,}15 \\[5px] &= 15\ \% \end{align*} $$
Graph
Normalverteilung
Dichtefunktion
$$ f(x) = \frac{1}{\sigma \cdot \sqrt{2\pi}}\textrm{e}^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} $$
Im Beispiel gilt:$\mu = 3$
$\sigma = 1$
Verteilungsfunktion
$$ F(x) = \frac{1}{\sigma \cdot \sqrt{2\pi}}\int_{-\infty}^{x}\! \textrm{e}^{-\frac{1}{2}\left(\frac{u-\mu}{\sigma}\right)^2} \textrm{d}u $$
Im Beispiel gilt:$\mu = 3$
$\sigma = 1$
Stetige Gleichverteilung
Dichtefunktion
$$ \begin{equation*} f(x) = \begin{cases} 0 & \text{für } x < a \\[5px] \frac{1}{b-a} & \text{für } a \le x \le b \\[5px] 0 & \text{für } x > b \end{cases} \end{equation*} $$
Im Beispiel gilt:$a = 2$
$b = 4$
Verteilungsfunktion
$$ \begin{equation*} F(x) = \begin{cases} 0 & \text{für } x \le a \\[5px] \frac{x-a}{b-a} & \text{für } a < x < b \\[5px] 1 & \text{für } x \ge b \end{cases} \end{equation*} $$
Im Beispiel gilt:$a = 2$
$b = 4$
Exponentialverteilung
Dichtefunktion
$$ \begin{equation*} f(x) = \begin{cases} 0 & \text{für } x < 0 \\ \dfrac{1}{\mu}\textrm{e}^{-\frac{x}{\mu}} & \text{für } x \geq 0 \end{cases} \end{equation*} $$
Im Beispiel gilt:$\mu = 3$
Verteilungsfunktion
$$ \begin{equation*} F(x) = \begin{cases} 0 & \text{für } x < 0 \\ 1-\textrm{e}^{-\frac{x}{\mu}} & \text{für } x \geq 0 \end{cases} \end{equation*} $$
Im Beispiel gilt:$\mu = 3$