Varianz

In diesem Kapitel schauen wir uns die Varianz einer Verteilung an.

Problemstellung

Wir wissen bereits, dass sich die Wahrscheinlichkeitsverteilung einer Zufallsvariablen entweder

vollständig beschreiben lässt.

Häufig ist eine vollständige Beschreibung der Verteilung gar nicht notwendig. Um sich einen groben Überblick über eine Verteilung zu verschaffen, betrachtet man einige charakteristische Maßzahlen. Eine dieser Maßzahlen lernen wir im Folgenden etwas besser kennen.

Die Varianz ist eine Maßzahl*
zur Charakterisierung einer Wahrscheinlichkeitsverteilung.

* statt Maßzahl sagt man auch Kennzahl oder Kennwert

Welche Aussage trifft die Varianz?

Die Varianz ist ein „Streuungsparameter“. Unter diesem Begriff werden alle Maßzahlen zusammengefasst, die eine Aussage über die Streuung einer Verteilung machen.

Die Varianz beschreibt die erwartete quadratische Abweichung
der Zufallsvariablen von ihrem Erwartungswert.

Nachteil der Varianz ist, dass sie aufgrund der Quadrierung eine andere Einheit als die beobachteten Messwerte besitzt. Auf den ersten Blick können somit keine konkreten Aussagen über die Streuungsbreite abgeleitet werden. In der Praxis wird daher häufig die Standardabweichung, die sich aus Quadratwurzel der Varianz ergibt, herangezogen.

Varianz einer diskreten Verteilung

In den folgenden beiden Abbildungen sind zwei Wahrscheinlichkeitsfunktionen dargestellt.
Erkennst du den Unterschied zwischen einer kleinen und einer großen Varianz?

Die Realisationen von \(X\) sind eng
um den Erwartungswert \(\mu = 0\) gestreut.



\(\Rightarrow\) kleine Varianz

Die Realisationen von \(X\) sind breit
um den Erwartungswert \(\mu = 0\) gestreut.



\(\Rightarrow\) große Varianz

Im Folgenden schauen wir uns an, wie man die Varianz berechnet.

Ist \(X\) eine diskrete Zufallsvariable, so heißt

\[\sigma^2_{X} = \mathrm{Var(X)} = \sum_i (x_i - \mu_{X})^2 \cdot P(X = x_i)\]

die Varianz von \(X\).

Dabei steht \(\mu_{X}\) für den Erwartungswert.

Verschiebungssatz für diskrete Zufallsvariablen

\[\begin{align*}
\sigma^2_{X} = \mathrm{Var}(X) &= \mathrm{E}(X^2) - (\mathrm{E}(X))^2\\
&= \sum_i x_i^2 \cdot P(X = x_i) - (\mathrm{E}(X))^2
\end{align*}\]

Der Verschiebungssatz erleichtert meist die Berechnung der Varianz.

Beispiel 1

Die Zufallsvariable \(X\) sei die Augenzahl beim Wurf eines symmetrischen Würfels.

Es gibt sechs mögliche Realisationen:
\(x_1 = 1\), \(x_2 = 2\), \(x_3 = 3\), \(x_4 = 4\), \(x_5 = 5\), \(x_6 = 6\)

Alle sechs Realisationen haben die gleiche Wahrscheinlichkeit:
\(p_1 = p_2 = p_3 = p_4 = p_5 = p_6 = \frac{1}{6}\)

\(\begin{array}{r|r|r|r|r|r|r}
\text{Augenzahl } x_i & 1 & 2 & 3 & 4 & 5 & 6\\
\hline P(X = x_i) & \frac{1}{6} & \frac{1}{6} & \frac{1}{6} & \frac{1}{6} & \frac{1}{6} & \frac{1}{6}
\end{array}\)

Der Erwartungswert ist \({\color{blue}\mu_{X} = \mathrm{E}(X) = 3,5}\).
[Ausführlicher Rechenweg: Erwartungswert einer diskreten Zufallsvariablen - Beispiel 1]

> Varianz berechnen (ohne Verschiebungssatz)

\(\begin{align*}
\mathrm{Var(X)} &= \sum_i (x_i - {\color{blue}\mu_{X}})^2 \cdot P(X = x_i)\\
&= (1 - {\color{blue}3,5})^2 \cdot \frac{1}{6} + (2 - {\color{blue}3,5})^2 \cdot \frac{1}{6} + (3 - {\color{blue}3,5})^2 \cdot \frac{1}{6}\\
&\quad+ (4 - {\color{blue}3,5})^2 \cdot \frac{1}{6} +(5 -{\color{blue}3,5})^2 \cdot \frac{1}{6} +(6 - {\color{blue}3,5})^2 \cdot \frac{1}{6}\\
&= \frac{35}{12} \approx 2,92
\end{align*}\)

> Varianz berechnen (mit Verschiebungssatz)

\(\begin{align*}
\mathrm{Var(X)} &= \sum_i x_i^2 \cdot P(X = x_i) - ({\color{blue}\mathrm{E}(X)})^2\\
&= 1^2 \cdot \frac{1}{6} + 2^2 \cdot \frac{1}{6} + 3^2 \cdot \frac{1}{6} + 4^2 \cdot \frac{1}{6} + 5^2 \cdot \frac{1}{6} + 6^2 \cdot \frac{1}{6} - {\color{blue}3,5}^2\\
&= \frac{91}{6} - \frac{49}{4}\\
&= \frac{35}{12} \approx 2,92
\end{align*}\)

Beispiel 2

Die Zufallsvariable \(X\) sei der Gewinn beim Roulette.

Wir setzen 1 Euro auf unsere Glückszahl. Falls wir gewinnen, erhalten wir 18 Euro.
Zur Erinnerung: Beim Roulette kann man auf die Zahlen 0 bis 36 setzen.

Es gibt zwei Realisationen:
\(x_1 = -1\) (falls wir verlieren)
\(x_2 = 18\) (falls wir gewinnen)

Für die Wahrscheinlichkeiten gilt:
\(p_1 = \frac{36}{37}\) (in 36 von 37 Fällen verlieren wir)
\(p_2 = \frac{1}{37}\) (in 1 von 37 Fällen gewinnen wir)

\(\begin{array}{r|r|r}
\text{Gewinn } x_i & -1 & 18 \\
\hline P(X = x_i) & \frac{36}{37} & \frac{1}{37}
\end{array}\)

Der Erwartungswert ist \({\color{blue}\mu_{X} =\mathrm{E}(X) = -\frac{18}{37}}\).
[Ausführlicher Rechenweg: Erwartungswert einer diskreten Zufallsvariablen - Beispiel 2]

> Varianz berechnen (ohne Verschiebungssatz)

\(\begin{align*}
\mathrm{Var(X)} &= \sum_i (x_i - {\color{blue}\mu_{X}})^2 \cdot P(X = x_i)\\
&= \left(-1 - \left({\color{blue}\:-\:\frac{18}{37}}\right) \right)^2 \cdot \frac{36}{37} + \left(18 - \left({\color{blue}\:-\:\frac{18}{37}}\right)\right)^2 \cdot \frac{1}{37}\\
&= \frac{12996}{1369} \approx 9,49
\end{align*}\)

> Varianz berechnen (mit Verschiebungssatz)

\(\begin{align*}
\mathrm{Var(X)} &= \sum_i x_i^2 \cdot P(X = x_i) - ({\color{blue}\mathrm{E}(X)})^2\\
&= (-1)^2 \cdot \frac{36}{37} + 18^2 \cdot \frac{1}{37} - \left({\color{blue}-\frac{18}{37}}\right)^2\\
&= \frac{12996}{1369} \approx 9,49
\end{align*}\)

Varianz einer stetigen Verteilung

In den folgenden beiden Abbildungen sind zwei Dichtefunktionen dargestellt.
Erkennst du den Unterschied zwischen einer kleinen und einer großen Varianz?

Die Realisationen von \(X\) sind eng
um den Erwartungswert \(\mu = 0\) gestreut.



\(\Rightarrow\) kleine Varianz

Die Realisationen von \(X\) sind breit
um den Erwartungswert \(\mu = 0\) gestreut.



\(\Rightarrow\) große Varianz

Im Folgenden schauen wir uns an, wie man die Varianz berechnet.

Ist \(X\) eine stetige Zufallsvariable, so heißt

\[\sigma^2_{X} = \mathrm{Var}(X) = \int_{-\infty}^{\infty} \! (x - \mu_{X})^2 \cdot f(x) \, \mathrm{d}x\]

die Varianz von \(X\).

Dabei steht \(\mu_{X}\) für den Erwartungswert und \(f(x)\) für die Dichtefunktion.

Verschiebungssatz für stetige Zufallsvariablen

\[\begin{align*}
\sigma^2_{X} = \mathrm{Var}(X) &= \mathrm{E}(X^2) - (\mathrm{E}(X))^2\\
&= \left(\int_{-\infty}^{\infty} \! x^2 \cdot f(x) \, \mathrm{d}x\right) - (\mathrm{E}(X))^2
\end{align*}\]

Der Verschiebungssatz erleichtert meist die Berechnung der Varianz.

Beispiel 1

Ein Zufallsgenerator erzeugt zufällig eine Zahl zwischen -1 und 1.

Die Dichtefunktion des Zufallsgenerators ist

\(\begin{equation*}
f(x) =
\begin{cases}
0 & \text{für } x < -1\\
0,5 & \text{für } -1 \le x \le 1 \\
0 & \text{für } x > 1
\end{cases}
\end{equation*}\)

Der Erwartungswert ist \({\color{blue}\mu_{X} = \mathrm{E}(X) = 0}\).
[Ausführlicher Rechenweg: Erwartungswert einer stetigen Zufallsvariablen - Beispiel 1]

> Varianz berechnen (ohne Verschiebungssatz)

\[\begin{align*}
\mathrm{Var}(X) &= \int_{-\infty}^{\infty} \! (x - {\color{blue}\mu_{X}})^2 \cdot f(x) \, \mathrm{d}x\\
&= \underbrace{\cancel{\int_{-\infty}^{-1} \! (x-{\color{blue}0})^2 \cdot 0 \, \mathrm{d}x}}_{\text{1. Abschnitt}}
+ \underbrace{\vphantom{\cancel{\int_{-\infty}^{-1} \! (x-{\color{blue}0})^2 \cdot 0 \, \mathrm{d}x}}\int_{-1}^{1} \! (x-{\color{blue}0})^2 \cdot 0,5 \, \mathrm{d}x}_{\text{2. Abschnitt}}
+ \underbrace{\cancel{\int_{1}^{\infty} \! (x-{\color{blue}0})^2 \cdot 0 \, \mathrm{d}x}}_{\text{3. Abschnitt}}\\
&= \int_{-1}^{1} \! (x-0)^2 \cdot 0,5 \, \mathrm{d}x\\
&= \int_{-1}^{1} \! x^2 \cdot 0,5 \, \mathrm{d}x\\
&= \int_{-1}^{1} \! \frac{1}{2}x^2 \, \mathrm{d}x\\
&= \left[\frac{1}{6}x^3\right]_{{\color{maroon}-1}}^{{\color{red}1}}\\
&= \frac{1}{6}\cdot {\color{red}1}^3 - \frac{1}{6}\cdot ({\color{maroon}-1})^3\\
&= \frac{1}{6} + \frac{1}{6}\\
&= \frac{2}{6}\\
&= \frac{1}{3}
\end{align*}\]

> Varianz berechnen (mit Verschiebungssatz)

\[\begin{align*}
\mathrm{Var}(X) &= \left(\int_{-\infty}^{\infty} \! x^2 \cdot f(x) \, \mathrm{d}x\right) - ({\color{blue}\mathrm{E}(X)})^2\\
&= \underbrace{\cancel{\int_{-\infty}^{-1} \! x^2 \cdot 0 \, \mathrm{d}x}}_{\text{1. Abschnitt}}
+ \underbrace{\vphantom{\cancel{\int_{-\infty}^{-1} \! x^2 \cdot 0 \, \mathrm{d}x}}\int_{-1}^{1} \! x^2 \cdot 0,5 \, \mathrm{d}x}_{\text{2. Abschnitt}}
+ \underbrace{\cancel{\int_{1}^{\infty} \! x^2 \cdot 0 \, \mathrm{d}x}}_{\text{3. Abschnitt}}
- {\color{blue}0}^2\\
&= \int_{-1}^{1} \! x^2 \cdot 0,5 \, \mathrm{d}x - 0^2\\
&= \int_{-1}^{1} \! \frac{1}{2}x^2 \, \mathrm{d}x\\
&= \left[\frac{1}{6}x^3\right]_{{\color{maroon}-1}}^{{\color{red}1}}\\
&= \frac{1}{6}\cdot {\color{red}1}^3 - \frac{1}{6}\cdot ({\color{maroon}-1})^3\\
&= \frac{1}{6} + \frac{1}{6}\\
&= \frac{2}{6}\\
&= \frac{1}{3}
\end{align*}\]

Beispiel 2

Gegeben ist eine Zufallsvariable \(X\) mit der Dichtefunktion

\(\begin{equation*}
f(x) =
\begin{cases}
0 & \text{für } x < 0 \\
\frac{1}{4}x & \text{für } 0 \le x < 2 \\
1 - \frac{1}{4}x & \text{für } 2 \le x \le 4 \\
0 & \text{für } x > 4
\end{cases}
\end{equation*}\)

Der Erwartungswert ist \({\color{blue}\mu_{X} = \mathrm{E}(X) = 2}\).
[Ausführlicher Rechenweg: Erwartungswert einer stetigen Zufallsvariablen - Beispiel 2]

> Varianz berechnen (ohne Verschiebungssatz)

\[\begin{align*}
\mathrm{Var}(X) &= \int_{-\infty}^{\infty} \! (x - {\color{blue}\mu_{X}})^2 \cdot f(x) \, \mathrm{d}x\\
&= \underbrace{\cancel{\int_{-\infty}^{0} \! (x-{\color{blue}2})^2 \cdot 0 \, \mathrm{d}x}}_{\text{1. Abschnitt}}
+ \underbrace{\vphantom{\cancel{\int_{-\infty}^{0} \! (x-{\color{blue}2})^2 \cdot 0 \, \mathrm{d}x}}\int_{0}^{2} \! (x-{\color{blue}2})^2 \cdot \frac{1}{4}x \, \mathrm{d}x}_{\text{2. Abschnitt}}\\
&\quad+ \underbrace{\vphantom{\cancel{\int_{-\infty}^{0} \! (x-{\color{blue}2})^2 \cdot 0 \, \mathrm{d}x}}\int_{2}^{4} \! (x-{\color{blue}2})^2 \cdot \left(1 - \frac{1}{4}x\right) \, \mathrm{d}x}_{\text{3. Abschnitt}}
+ \underbrace{\cancel{\int_{4}^{\infty} \! (x-{\color{blue}2})^2 \cdot 0 \, \mathrm{d}x}}_{\text{4. Abschnitt}}\\
&= \int_{0}^{2} \! (x-2)^2 \cdot \frac{1}{4}x \, \mathrm{d}x
+ \int_{2}^{4} \! (x-2)^2 \cdot \left(1 - \frac{1}{4}x\right) \, \mathrm{d}x\\
&= \int_{0}^{2} \! (x^2 - 4x + 4) \cdot \frac{1}{4}x \, \mathrm{d}x
+ \int_{2}^{4} \! (x^2 - 4x + 4) \cdot \left(1 - \frac{1}{4}x\right) \, \mathrm{d}x\\
&= \int_{0}^{2} \! \frac{1}{4}x^3 - x^2 + x \, \mathrm{d}x
+ \int_{2}^{4} \! x^2 - 4x + 4 -\frac{1}{4}x^3 + x^2 - x \, \mathrm{d}x\\
&= \int_{0}^{2} \! \frac{1}{4}x^3 - x^2 + x \, \mathrm{d}x
+ \int_{2}^{4} \! -\frac{1}{4}x^3 + 2x^2 - 5x + 4 \, \mathrm{d}x\\
&= \left[\frac{1}{16}x^4 - \frac{1}{3}x^3 + \frac{1}{2}x^2\right]_{{\color{maroon}0}}^{{\color{red}2}}
+ \left[-\frac{1}{16}x^4 + \frac{2}{3}x^3 - \frac{5}{2}x^2 + 4x\right]_{{\color{maroon}2}}^{{\color{red}4}}\\
&= \left(\frac{1}{16}\cdot {\color{red}2}^4 - \frac{1}{3} \cdot {\color{red}2}^3 + \frac{1}{2} \cdot {\color{red}2}^2 - \left(\frac{1}{16} \cdot {\color{maroon}0}^4 - \frac{1}{3} \cdot {\color{maroon}0}^3 + \frac{1}{2} \cdot {\color{maroon}0}^2\right)\right)\\
&\quad \left(-\frac{1}{16} \cdot {\color{red}4}^4 + \frac{2}{3} \cdot {\color{red}4}^3 - \frac{5}{2} \cdot {\color{red}4}^2 + 4 \cdot {\color{red}4} - \left(-\frac{1}{16} \cdot {\color{maroon}2}^4 + \frac{2}{3} \cdot {\color{maroon}2}^3 - \frac{5}{2} \cdot {\color{maroon}2}^2 + 4 \cdot {\color{maroon}2}\right)\right)\\
&= \left(1 - \frac{8}{3} + 2\right) + \left(-16 + \frac{128}{3} - 40 + 16 -\left(-1 + \frac{16}{3} - 10 + 8\right)\right)\\
&= \left(\frac{1}{3}\right) + \left(\frac{8}{3} -\left(\frac{7}{3}\right)\right)\\
&= \frac{1}{3} + \frac{8}{3} - \frac{7}{3}\\
&= \frac{2}{3}
\end{align*}\]

> Varianz berechnen (mit Verschiebungssatz)

\[\begin{align*}
\mathrm{Var}(X) &= \left(\int_{-\infty}^{\infty} \! x^2 \cdot f(x) \, \mathrm{d}x\right) - ({\color{blue}\mathrm{E}(X)})^2\\
&= \underbrace{\cancel{\int_{-\infty}^{0} \! x^2 \cdot 0 \, \mathrm{d}x}}_{\text{1. Abschnitt}}
+ \underbrace{\vphantom{\cancel{\int_{-\infty}^{0} \! x^2 \cdot 0 \, \mathrm{d}x}}\int_{0}^{2} \! x^2 \cdot \frac{1}{4}x \, \mathrm{d}x}_{\text{2. Abschnitt}}\\
&\quad+ \underbrace{\vphantom{\cancel{\int_{-\infty}^{0} \! x^2 \cdot 0 \, \mathrm{d}x}}\int_{2}^{4} \! x^2 \cdot \left(1 - \frac{1}{4}x\right) \, \mathrm{d}x}_{\text{3. Abschnitt}}
+ \underbrace{\cancel{\int_{4}^{\infty} \! x^2 \cdot 0 \, \mathrm{d}x}}_{\text{4. Abschnitt}} - {\color{blue}2}^2\\
&= \int_{0}^{2} \! x^2 \cdot \frac{1}{4}x \, \mathrm{d}x
+ \int_{2}^{4} \! x^2 \cdot \left(1 - \frac{1}{4}x\right) \, \mathrm{d}x - 2^2\\
&= \int_{0}^{2} \! \frac{1}{4}x^3 \, \mathrm{d}x
+ \int_{2}^{4} \!  -\frac{1}{4}x^3 + x^2 \, \mathrm{d}x - 2^2\\
&= \left[\frac{1}{16}x^4\right]_{{\color{maroon}0}}^{{\color{red}2}}
+ \left[-\frac{1}{16}x^4 + \frac{1}{3}x^3\right]_{{\color{maroon}2}}^{{\color{red}4}} - 2^2\\
&= \left(\frac{1}{16} \cdot {\color{red}2}^4 - \frac{1}{16} \cdot {\color{maroon}0}^4\right)
+ \left(-\frac{1}{16} \cdot {\color{red}4}^4 + \frac{1}{3} \cdot {\color{red}4}^3 - \left(-\frac{1}{16} \cdot {\color{maroon}2}^4 + \frac{1}{3} \cdot {\color{maroon}2}^3\right)\right) - 2^2\\
&= \left(1 - 0\right) + \left(-16 + \frac{64}{3} -\left(-1 + \frac{8}{3}\right)\right) - 2^2\\
&= 1 - 16 + \frac{64}{3} + 1 - \frac{8}{3} - 4\\
&= \frac{2}{3}
\end{align*}\]

Wir merken uns:

Eine Wahrscheinlichkeitsverteilung lässt sich entweder

vollständig beschreiben.

Häufig ist eine vollständige Beschreibung der Verteilung gar nicht notwendig. Um sich einen groben Überblick über eine Verteilung zu verschaffen, betrachtet man einige charakteristische Maßzahlen. Dazu zählen u.a. der Erwartungswert, die Varianz und die Standardabweichung.

Andreas Schneider

Jeden Tag suche ich für dich nach der verständlichsten Erklärung.

Ich hoffe, dass sich meine Arbeit lohnt und ich dir helfen kann.

Weiterhin viel Erfolg beim Lernen!

Dein Andreas

PS: Ich freue mich, wenn du mir mal schreibst!