Stetige Wahrscheinlichkeitsverteilungen

Eine stetige Zufallsvariable kann (in einem bestimmten Bereich) jeden beliebigen Wert annehmen. Man kann sie durch ihre Dichtefunktion f oder durch die Verteilungsfunktion F beschreiben (die Dichtefunktion ist die Ableitung der Verteilungsfunktion). Die Wahrscheinlichkeit, dass X zwischen a und b liegt, entspricht der Fläche unter der Kurve, also dem Integral:

P(a<=X<=b) = Integral(a..b)f(x)dx = F(b) - F(a).

Dichtefunktion der Normalverteilung, Fläche zwichen a und b schraffiert

Die gesamte Fläche unter der Kurve ist 1 (sicheres Ereignis). Die Wahrscheinlichkeit, dass X einen bestimmten Wert annimmt, ist bei stetigen Verteilungen 0. Daher ist es egal, ob man P(X < a) oder P(X ≤ a) berechnet.

Auch Erwartungswert und Standardabweichung einer stetigen Verteilung werden mit Hilfe des Integrals definiert.

Die Normalverteilung

Die wichtigste stetige Wahrscheinlichkeitsverteilung ist die von C. F. Gauß (1777 - 1855) entdeckte Normalverteilung mit der Dichtefunktion:

f(x) = 1/(sigma*Wurzel(2*pi))*e^((-1/2)*((x-my)/sigma)^2)

μ: Erwartungswert, σ: Standardabweichung

Sie tritt bei vielen Größen im Alltag auf. Der Graph der Dichtefunktion (links) ist die bekannte "Glockenkurve" ; sie besitzt einen Hochpunkt bei μ und zwei Wendepunkte bei μ ± σ. Der Erwartungswert gibt also an, wo der Gipfel der Verteilung liegt; die Standardabweichung bestimmt die Form der Kurve (hoch und schmal oder niedrig und breit.)
Die Verteilungsfunktion (rechts) ist eine s-förmige Kurve mit einem Wendepunkt W = (μ / 0,5).

Dichtefunktion der Normalverteilung mit Hochpunkt und Wendepunkten Verteilungsfunktion der Normalverteilung

Es gilt folgende Faustregel:

P(μ − σ ≤ X ≤ μ + σ) = 68 % ≈ 2/3
P(μ − 2·σ ≤ X ≤ μ + 2·σ) = 95 %
P(μ − 3·σ ≤ X ≤ μ + 3·σ) > 99 %

Die Wahrscheinlichkeiten für beliebige Werte kann man mit dem Taschenrechner oder anderer Technologie berechnen. Der entsprechende Befehl lautet "normalCdf" oder ähnlich. Wenn die Wahrscheinlichkeit gegeben ist und der dazugehörige x-Wert gesucht wird, braucht man die Umkehrfunktion "invNorm".

Berechnung der Normalverteilung mit Tabelle

Wenn man keine Technologie zur Verfügung hat, muss man eine Tabelle der Standardnormalverteilung φ mit Erwartungswert 0 und Standardabweichung 1 verwenden (z.B. hier).

phi(z) = 1/Wurzel(2*pi)*e^(-1/2*z^2)

In der Tabelle sind die Werte der Verteilungsfunktion Φ angeführt, also die Wahrscheinlichkeit, dass die normierte Zufallsvariable Z ≤ z ist:
P(Z ≤ z) = Φ(z)

Dichtefunktion der Standardnormalverteilung mit Fläche links von z

Eine beliebige Normalverteilung kann man durch die Standardisierungsformel

z = (x-my)/sigma

in die Standardnormalverteilung umrechnen.

Beispiel: Eine Machine erzeugt Nägel mit einer durchschnittlichen Länge von μ = 50 mm. Die Länge der Nägel ist normalverteilt, die Standardabweichung beträgt σ = 2,5 mm.

Annäherung der Binomialverteilung durch die Normalverteilung

Wenn die Anzahl der Versuche sehr groß ist, wird die Berechnung der Binomialverteilung zu aufwändig. Man kann sie dann näherungsweise durch die Normalverteilung mit demselben μ und σ ersetzen.
(Faustregel: σ muss ≥ 3 sein.)

Beispiel:

Wie groß ist die Wahrscheinlichkeit, bei 300-maligem Würfeln höchstens 40 mal Sechs zu werfen?
n = 300, p = 1/6 ⇒ μ = 300·1/6 = 50, σ = √(300·1/6·5/6) = 6,45
z = (40 − 50)/6,45 = −1,55
P(X ≤ 40) = Φ(−1,55) = 0,0606

Die Annnäherung wird noch genauer, wenn man die Stetigkeitskorrektur berücksichtigt.
Im Histogramm der Binomialverteilung reicht z.B. der Streifen, der X = 40 entspricht, von 39,5 bis 40,5.
Für die Berechnung von P(X ≤ 40) nimmt man daher 40,5 als obere Grenze.
Für P(40 ≤ X ≤ 50) nimmt man die Grenzen 39,5 und 50,5.

Im obigen Beispiel erhält man mit Stetigkeitskorrektur:
z = (40,5 − 50)/6,45 = −1,47
P(X ≤ 40) = Φ(−1,47) = 0,0708

Die genaue Berechnung mit Binomialverteilung ergibt 0,0675.)

Weitere stetige Wahrscheinlichkeitsverteilungen

Lernziele

Übungen