Konfidenzintervall für Normal- bzw. Standardnormalverteilung
Bei der Ermittlung statistischer Parameter wie Mittelwert oder Standardabweichung prüft man selten alle möglichen Ergebnisse, sondern man beschränkt sich auf eine Stichprobe. Dadurch ist die Messung aber Ungenauigkeiten unterworfen.
Das Konfidenzintervall definiert einen Bereich, in dem man mit einer bestimmten Wahrscheinlichkeit (dem Konfidenzniveau \(\gamma\)) darauf vertrauen darf, dass sich der wahre Wert einer Zufallsgröße darin befindet. Typische Werte für das Konfidenzniveau liegen bei 90%, 95% oder bei 99%. Umgekehrt kann man die Frage nach dem erforderlichen Stichprobenumfang klären, wenn man ein konkretes Konfidenzintervall vorgibt.
Vereinfachte Merksätze:
- Größere Stichprobe ergibt ein schmäleres Konfidenzintervall (Hochrechnung bei Wahlen: höherer Auszählungsgrad → geringere Schwankungsbreite)
- Größere Sicherheit (höheres Konfidenzniveau = höherer Prozentsatz beim Konfidenzintervall) bedeutet breiteres Konfidenzintervall
- Je näher der Prozentsatz an der 50 % Grenze liegt, umso breiter wird das Konfidenzintervall. Das heißt je deutlicher Zustimmung bzw. Ablehnung sind, umso schmäler wird das Konfidenzintervall
Für diejenigen Werte p, in deren das \(\gamma\) Konfidenzintervall der Wert h liegt, gilt
\({p_{1,2}} = \left[ {h - z \cdot \sqrt {\dfrac{{h \cdot \left( {1 - h} \right)}}{n}} ;\,\,\,\,h + z \cdot \sqrt {\dfrac{{h \cdot \left( {1 - h} \right)}}{n}} } \right]\)
h | relative Häufigkeit in einer Stichprobe |
p | unbekannter relativer Anteil in der Grundgesamtheit |
\(\gamma\) | Konfidenz- / Vertrauensniveau |
n | Umfang der Stichprobe |
z | Ist aus der Tabelle der Standardnormalverteilung abzulesen
Für das 95%-Konfidenzintervall gilt beispielhaft: \(\eqalign{ & 2 \cdot \Phi \left( z \right) - 1 = 0,95 \cr & \Phi \left( z \right) = \dfrac{{1,95}}{2} = 0,975 \cr} \) Aus der Tabelle der Standardnormalverteilung können wir ablesen: \(z\left( {0,975} \right) = 1,96\) |
Illustration zur Veranschaulichung:
Die Fläche unter der gaußschen Glockenkurve und zwischen den Intervallgrenzen p1 bzw. p2 errechnet sich zu \(2\Phi \left( z \right) - 1 = \gamma \).
Das zugehörige z kann man auf 2 Arten aus den entsprechenden Tabellen ermitteln:
- man geht mit dem Wert \(\Phi \left( z \right) = \dfrac{{\gamma + 1}}{2}\) in eine \(\Phi \left( z \right) \Rightarrow z\) Tabelle und liest z ab
- man geht mit dem Wert \(D\left( z \right) = \gamma \) in eine \(D\left( z \right) \Rightarrow z\) Tabelle und liest z ab
α von 5 % bzw. z(0,975)=1,96 bedeutet, dass das Intervall den gesuchten Wert der Grundgesamtheit mit 95 % Wahrscheinlichkeit enthält.
Zweiseitiges (1 – α)-Konfidenz- /Schwankungsintervall für einen Einzelwert einer normalverteilten Zufallsvariablen
\(\left[ {\mu - {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \sigma ;\,\,\,\,\,\mu + {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \sigma } \right]\)
Zweiseitiges (1 – α)-Konfidenz- /Schwankungsintervall für den Stichprobenmittelwert normalverteilter Werte
\(\left[ {\mu - {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{\sigma }{{\sqrt n }};\,\,\,\,\,\mu + {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \sigma \cdot \dfrac{\sigma }{{\sqrt n }}} \right]\)
Zweiseitiges (1– α)-Konfidenz- /Schwankungsintervall für den Erwartungswert einer normalverteilten Zufallsvariablen bei bekanntem σ und bekanntem Mittelwert der Zufallsstichprobe
\(\left[ {\overline x - {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{\sigma }{{\sqrt n }};\,\,\,\,\,\overline x + {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{\sigma }{{\sqrt n }}} \right]\)
\(\overline x\) | Stichprobenmittelwert |
\({s_{\overline x }} = {s_{n - 1}}\) | Standardabweichung einer Stichprobe |
n | Stichprobenumfang |
\({z_{1\, - \,\dfrac{\alpha }{2}}}\) |
\(\left( {1 - \dfrac{\alpha }{2}} \right)\)- Quantil der Standardnormalverteilung, wobei: \(\begin{array}{l} P\left( { - z \le Z \le z} \right) = 90\% \to z = 1,654\\ P\left( { - z \le Z \le z} \right) = 95\% \to z = 1,960\\ P\left( { - z \le Z \le z} \right) = 99\% \to z = 2,576 \end{array}\) |
Konfidenzintervall für die studentsche t-Verteilung
Wenn die Standardabweichung σ der Grundgesamtheit unbekannt ist, man aber die Standardabweichung s der Stichprobe kennt und man nur einen kleinen Stichprobenumfang hat, benützt man anstelle der Normalverteilung die (studentsche) t-Verteilung.
Die Grundgesamtheit muss dabei (annähernd) normalverteilt sein. Die t-Verteilung hat ein glockenförmiges Aussehen, die Fläche unter der Glocke ist 1 und sie ist symmetrisch um Null. Median, Modus und Mittelwert sind null.
- Der 1. Parameter der t-Verteilung ist deren Freiheitsgrad f, der sich zu f=n-1 ergibt.
- Stichprobenumfang n=8 → f=8-1=7
- Der 2. Parameter ergibt sich gemäß \(\left( {1 - \dfrac{\alpha }{2}} \right)\)
- zweiseitiger 95% Vertrauensbereich: \(\alpha = 5\% \overset{\wedge}\to{=} 0,05 \to 1 - \frac{{0,05}}{2} = 0,975\)
Mit den beiden Werten geht geht man in die t-Tabelle und liest wie folgt ab: \({t_{7;0,975}} \approx 2,3646{\text{ }}\)
Zweiseitiges (1– α)- Konfidenz- /Schwankungsintervall für den Erwartungswert einer normalverteilten Zufallsvariablen bei unbekanntem σ
\(\left[ {\overline x - {t_{f;\,\,1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{{{s_{n - 1}}}}{{\sqrt n }};\,\,\,\,\,\overline x + {t_{f;\,\,1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{{{s_{n - 1}}}}{{\sqrt n }}} \right]\)
mit
\({t_{f;\,\,\,1\, - \,\dfrac{\alpha }{2}}}\) | \(\left( {1 - \dfrac{\alpha }{2}} \right)\)- Quantil der t-Verteilung mit f Freiheitsgraden |
α von 5 % (bei der Normalverteilung: z(0,975)=1,96) bedeutet, dass das Intervall den gesuchten Wert der Grundgesamtheit mit 95 % Wahrscheinlichkeit enthält. \({\dfrac{\alpha }{2}}\buildrel \wedge \over =2,5% \) der Werte liegen links vom Intervall und \({\dfrac{\alpha }{2}}\buildrel \wedge \over =2,5% \) der Werte liegen rechts vom Intervall.
Die Berechnung des Konfidenzintervalls kann z.B. mit dem Wahrscheinlichkeitsrechner von GeoGebra erfolgen:
Wahrscheinlichkeitsrechner
- Statistik
- T-Schätzung eines Mittelwerts
- Eingabe von 4 Werten erforderlich:
- Konfidenzniveau:
- Mittelwert der Stichprobe:
- Standardabweichung s der Stichprobe:
- Größe n der Stichprobe
- Eingabe von 4 Werten erforderlich:
- T-Schätzung eines Mittelwerts