Schließende Statistik - Wahrscheinlichkeitsrechnung
Hier findest du folgende Inhalte
Formeln
Stetige Zufallsvariable
Man spricht von einer stetigen Zufallsvariablen, wenn die Anzahl der Ergebnisse des Zufallsexperiments unendlich,also nicht abzählbar, ist. Sie wird durch eine Dichtefunktion und/oder eine Verteilungsfunktion beschrieben.
Spezielle Verteilungen stetiger Zufallsvariabler sind
- Rechtecksverteilung
- Exponentialverteilung
- Normalverteilung
- Standardnormalverteilung
Dichtefunktion
Die Fläche unter der Dichtefunktion beschreibt (mittels Integralrechnung) die Wahrscheinlichkeit dafür, dass die stetige Zufallsvariable innerhalb vom Intervall [a, b] liegt. Umgekehrt bedeutet dies, dass in Intervallen in denen die Dichte (de-facto) Null ist auch (de-facto) keine Realisierungen von X liegen, während in Intervallen mit hoher Dichte auch eine große Anzahl an Realisierungen von X liegen.
Dichtefunktion f(x): \(P\left( {a < X \le b} \right) = \int\limits_a^b {f\left( x \right)} \,\,dx = F\left( b \right) - F\left( a \right)\) , wobei die Fläche unter der Dichtefunktion normiert ist gemäß: \(\int\limits_{ - \infty }^\infty {f\left( x \right)} \,\,{\mathop{\rm dx}\nolimits} = 1\)
Die Dichtefunktion ist für stetige Zufallsvariablen das Äquivalent zur Wahrscheinlichkeitsfunktion von diskreten Zufallsvariablen. Sie kann nur positive Werte annehmen und die gesamte Fläche unter ihrem Graph hat den Wert 1. Aus der Dichtefunktion f(x) lässt sich keine Wahrscheinlichkeit P(X) ablesen, da die Wahrscheinlichkeit dafür, dass eine stetige Zufallsvariable X einen konkreten Wert x annimmt, Null ist. Es gilt also: \(f\left( x \right) \ne P\left( {X = x} \right)\)
Zwischen der Dichtefunktion f(x) und der Verteilungsfunktion F(x) besteht folgender Zusammenhang:
\(\begin{array}{l} f\left( x \right) = F'\left( x \right)\\ F\left( X \right) = \int\limits_{ - \infty }^\infty {f(t)\,\,dt} \end{array}\)
Durch Ableiten der Verteilfunktion F erhält man die Dichtefunktion. Aus einer gegebenen Dichtefunktion f erhält man durch Integrieren die Verteilfunktion F.
Verteilungsfunktion
Die Verteilungsfunktion F(x) einer stetigen Zufallsvariablen gibt die Wahrscheinlichkeit dafür an, dass eine Zufallsvariable X einen Wert der kleiner oder gleich x annimmt. Sie entspricht der Fläche unter der Dichtefunktion f(t), die sich bis zum Wert x kumuliert hat.
\(F(X) = \int\limits_{ - \infty }^\infty {f\left( t \right)} \,\,dt\)
Weil bei stetigen Zufallsvariablen die Wahrscheinlichkeit für jeden einzelnen Wert Null ist, gemäß \(P(X = x) = 0\) ist es egal, ob die Intervallgrenze zum Intervall gezählt wird [a, b], oder ob nicht (a, b):
\(P\left( {a \le X \le b} \right) = P\left( {a < X \le b} \right) = P\left( {a \le X < b} \right) = P\left( {a < X < b} \right) = F(b) - F(a)\)
Erwartungswert
Der Erwartungswert E(X) einer stetigen Zufallsvariable X gibt an, welchen Wert die Zufallsvariable X im Mittel bei einer unbegrenzten Wiederholung annimmt. Gegenüber dem Erwartungswert einer diskreten Verteilung ersetzt man bei der stetigen Verteilung die Summe durch das Integral und die Wahrscheinlichkeit P(X=xi) durch die Dichtefunktion f(x).
\(E(X) = \mu = \int\limits_{ - \infty }^\infty {x \cdot f\left( x \right)} \,\,dx\)
Varianz
Die Varianz einer stetigen Zufallsvariablen ist die mittlere quadratische Abweichung der Zufallsvariablen von ihrem Erwartungswert und somit ein Streumaß der beschreibenden Statistik.
\({\sigma _x}^2 = Var\left( X \right) = E{\left( {X - {\mu _x}} \right)^2} = \int\limits_{ - \infty }^\infty {{{\left( {x - {\mu _x}} \right)}^2}} \cdot f\left( x \right)\,\,dx\)
Verschiebungssatz
Der Verschiebungssatz für stetige Zufallsvariablen kann den Rechenaufwand für die Berechnung der Varianz verringern.
- Der 1. Term ist das einfacher zu rechnende Integral von X2 , also dem Erwartungswert von X2
- Der 2. Term ist ganz simpel das Quadrat vom Erwartungswert von X
\({\sigma _x}^2 = Var(X) = E{\left( X \right)^2} - {\left( {E\left( X \right)} \right)^2} = \left( {\int\limits_{ - \infty }^\infty {{x^2} \cdot f\left( x \right)\,\,dx} } \right) - {\left( {E\left( X \right)} \right)^2}\)
Standardabweichung
Die Varianz einer stetigen Zufallsvariablen hat den Nachteil, als Einheit das Quadrat der Einheit der zugrunde liegenden Zufallsvariablen zu haben. Das ist bei der Standardabweichung (auf Grund der Quadratwurzel) und beim Erwartungswert nicht der Fall.
\({\sigma _x} = \sqrt {Var\left( X \right)} \)
Physikalische Analogie für den Erwartungswert und für die Varianz:
- Physikalisch entspricht der Erwartungswert dem Schwerpunkt. Man muss sich dabei die Massen R(X=xi) an den Positionen xi entlang vom Zahlenstrahl x plaziert vorstellen.
- Physikalisch entspricht die Varianz dem Trägheitsmoment, wenn man den oben beschriebenen Zahlenstrahl um eine Achse dreht, die senkrecht auf den Zahlenstrahl steht und die durch den Schwerpunkt verläuft
Schon den nächsten Urlaub geplant?
Auf maths2mind kostenlos auf Prüfungen vorbereiten!
Nach der Prüfung in Ruhe entspannen
Rechteckverteilung
Man wählt eine Rechteckverteilung, wenn sich für die stetige Zufallsvariable X eine Ober- bzw. Untergrenze angeben lässt, und alle Werte zwischen diesen beiden Grenzen gleich wahrscheinlich sind. Die Rechteckverteilung im Intervall [a, b] ist eine stetige Gleichverteilung, bei der jedes Ergebnis gleich wahrscheinlich ist. Sie hat also im Intervall [a, b] eine konstante Wahrscheinlichkeitsdichte von 1/(b-a).
Die Rechteckverteilung wird noch als stete Gleichverteilung, als kontinuierliche Gleichverteilung bzw. als Uniformverteilung bezeichnet.
Dichtefunktion der Rechteckverteilung
\(f\left( x \right) = \left\{ {\begin{array}{*{20}{c}} {\dfrac{1}{{b - a}}}&{a \le x \le b}\\ 0&{{\rm{sonst}}} \end{array}} \right.\)
Verteilfunktion der Rechteckverteilung
\(F\left( x \right) = \left\{ {\begin{array}{*{20}{c}} 0&{x \le a}\\ {\dfrac{{x - a}}{{b - a}}}&{a < x < b}\\ 1&{x \ge b} \end{array}} \right.\)
Erwartungswert der Rechteckverteilung
Der Erwartungswert und der Median der Rechteckverteilung sind gleich dem Wert in der Mitte des Intervalls [a,b].
\(\mu = E\left( X \right) = \int\limits_{ - \infty }^\infty {x \cdot f\left( x \right)} \,\,dx = \dfrac{{a + b}}{2}\)
Varianz der Rechteckverteilung
\(Var\left( X \right) = {\sigma ^2} = \dfrac{{{{\left( {b - a} \right)}^2}}}{{12}}\)
Exponentialverteilung
Die Exponetialfunktion von stetigen Zufallsvariablen wird zur Modellierung von der Zeit zwischen 2 Ereignissen oder der Lebensdauer von Bauteilen verwendet. Die stetige Exponentialverteilung wird durch die Ereignisrate \(\lambda\) - das ist die mittlere Anzahl der Ereignisse pro Zeiteinheit - bestimmt. Sie ist eine „gedächtnislose“ Funktion.
Dichtefunktion der Exponentialverteilung
Die Dichtefunktion sinkt umso steiler, je größer \(\lambda\) ist.
\(f\left( x \right) = \left\{ {\begin{array}{*{20}{c}} {\lambda \cdot {e^{ - \lambda x}}}&{x \ge 0}\\ 0&{x < 0} \end{array}} \right.\)
Verteilungsfunktion der Exponentialverteilung
Die Verteilungsfunktion steigt umso steiler, je größer \(\lambda\) ist.
\(F\left( x \right) = \left\{ {\begin{array}{*{20}{c}} {a - {e^{ - \lambda x}}}&{x \ge 0}\\ 0&{x < 0} \end{array}} \right.\)
Erwartungswert der Exponentialverteilung
\(E\left( X \right) = \dfrac{1}{\lambda }\)
Varianz der Exponentialverteilung
\(Var\left( x \right) = \dfrac{1}{{{\lambda ^2}}}\)
Gedächtnislosigkeit der Exponentialverteilung und der geometrischen Verteilung
Sie gibt die Wahrscheinlichkeit an, dass ein Ereignis (z.B. ein Produktfehler) nach weiteren t Minuten eintritt, nachdem man schon s Minuten gewartet hat. Man spricht auch von der "Nichtalterungseigenschaft".
Die Gedächtnislosigkeit ist eine spezielle Eigenschaft der Exponentialverteilung und der geometrischen Verteilung.
- Sie besagt, dass die bedingte Wahrscheinlich weitere s Zeiteinheiten zu überdauern unabhängig vom bis dahin erreichten Lebensalter ist , also für beliebige Vorbedingungen gleich ist. Die Zufallsvariable „merkt“ sich also nicht welches Lebensalter zum Betrachtungszeitpunkt bereits erreicht ist, und ist daher gedächtnislos. Bereits absolvierte Lebensdauer hat keinen Einfluss auf die Zukunft. Gegenstände altern nicht sonder versagen auf Grund zufälliger Ereignisse.
- Die Nichtalterungseigenschaft besagt, dass für ein gebrauchtes Bauteil, welches im Intervall (0,t) nicht ausgefallen ist, die Wahrscheinlichkeit noch länger als s zu funktionieren gleich groß ist, wie die Wahrscheinlichkeit für ein neues Bauteil noch länger als s zu funktionieren..
Eine Verteilung P mit der Verteilungsfunktion F heißt gedächtnislos, wenn für alle \(s,t \ge 0\) gilt: \(P\left( {X > s + t\left| {X > t} \right.} \right) = P\left( {X > s} \right)\) bzw. für stetige Verteilungen \(P\left( {X \ge s + t\left| {X \ge t} \right.} \right) = P\left( {X \ge s} \right)\)
Normalverteilung \(N\left( {\mu ;{\sigma ^2}} \right)\)
Die Normalverteilung, auch gaußsche Glockenverteilung genannt, ist zusammen mit ihrem Spezialfall (μ=0, σ2=1) der Standardnormalverteilung die wichtigste Verteilungsfunktion. Sie bietet sich immer dann an, wenn Werte innerhalb eines begrenzten Intervalls liegen und es kaum Ausreißer gibt. Bei großen Stichproben einer Binomialverteilung kann diese durch eine Normalverteilung approximiert werden.
2 Parameter:
- \(\mu = E\left( X \right)\) .. Erwartungswert, bestimmt an welcher Stelle das Maximum der Normalverteilung auftritt, d.h. er verschiebt die Dichte- und Verteilungsfunktion entlang der x-Achse
- \(\sigma ^2\) .. Varianz, ist ein Maß für die Streuung der Werte um den Erwartungswert, d.h. sie bestimmt wie breit die Dichtefunktion ist, bzw. wie steil die Verteilungsfunktion ansteigt
Wahrscheinlichkeit der Normalverteilung
Die Zufallsvariable X ist normalverteilt mit dem Erwartungswert \(\mu\) und der Varianz \(\sigma ^2\).
\(P\left( {X \leqslant {x_1}} \right) = \int\limits_{ - \infty }^{{x_1}} {f\left( x \right)} \,\,dx = \int\limits_{ - \infty }^{{x_1}} {\dfrac{1}{{\sigma \cdot \sqrt {2 \cdot \pi } }}} \cdot {e^{ - \,\,\dfrac{1}{2} \cdot {{\left( {\dfrac{{x - \mu }}{\sigma }} \right)}^2}}}\,\,dx\)
- Die Dichtefunktion der Normalverteilung \(N\left( {\mu ;{\sigma ^2}} \right)\) ist symmetrisch um die y-Achse, welche die x-Achse bei \(x = \mu = E\left( X \right)\) also beim Erwartungswert schneidet.
- Die Glockenkurve erreicht Ihr Maximum an der Stelle vom Erwartungswert. Hier liegen ebenfalls der Modus und der Median.
- Die Dichtefunktion der Normalverteilung \(N\left( {\mu ;{\sigma ^2}} \right)\) hat links und rechts vom Erwartungswert E(X) zwei Wendestellen, die jeweils genau 1 Standardabweichung \(\sigma\) vom Erwartungswert entfernt liegen.
- Die Dichtefunktion der Normalverteilung \(N\left( {\mu ;{\sigma ^2}} \right)\) ist stetig, von -∞ bis ∞ definiert und nähert sich der negativen und der positiven x- Achse an, ohne sie je zu berühren.
- Die Dichtefunktion der Normalverteilung \(N\left( {\mu ;{\sigma ^2}} \right)\) ist kein Maß für die Wahrscheinlichkeit eines einzelnen Werts, sondern grundsätzlich nur für ein Intervall.
- Die Standardabweichung \(\sigma\) bestimmt, den Verlauf der Dichtefunktion: Je kleiner \(\sigma\) ist, um so steiler wird der Graph
- Der Erwartungswert \( \mu = E\left( X \right)\) bestimmt hingegen, bei welchem x-Wert die Normalverteilung ihr Maximum hat. Ändert sich der Erwartungswert, so verschiebt sich die Normalverteilung entlang der x-Achse
- Die Verteilungsfunktion der Normalverteilung hat Ihren Wendepunkt \(WP\left( {\mu ,0.5} \right)\) an der Stelle vom Erwartungswert. An dieser Stelle hat die Dichtefunktion ihr Maximum
Sigma-Umgebungen
Zusammenhang zwischen Wendepunkt der Wahrscheinlichkeitsfunktion einer Normalverteilung und dem Erwartungswert
Der Erwartungswert ist der Wert mit der größten Wahrscheinlichkeit. Links und rechts vom Erwartungswert gruppieren sich die restlichen normalverteilten Wahrscheinlichkeiten.
Die Wendepunkte der Wahrscheinlichkeitsfunktion der Normalverteilung liegen eine Standardabweichung rechts vom Erwartungswert und eine Standardabweichung links vom Erwartungswert.
Wahrscheinlichkeiten für 1, 2 und 3-fache \(\sigma\) -Umgebungen:
\(\eqalign{ & P\left( {\mu - \sigma \leqslant X \leqslant \mu + \sigma } \right) \approx 0,683 \cr & P\left( {\mu - 2 \cdot \sigma \leqslant X \leqslant \mu + 2 \cdot \sigma } \right) \approx 0,954 \cr & P\left( {\mu - 3 \cdot \sigma \leqslant X \leqslant \mu + 3 \cdot \sigma } \right) \approx 0,997 \cr} \)
Obige Gleichungen in Worten:
Die Wahrscheinlichkeit, dass eine Zufallsvariable X einen Wert
- im Bereich µ+/- 1σ annimmt beträgt ca. 68,3%,
- im Bereich µ+/- 2σ annimmt beträgt ca. 95,4% und
- im Bereich µ+/- 3σ ist sie mit ca. 99,7% schon sehr nahe bei 100%.
Erwartungswert und Standardabweichung einer Normalverteilung
Die Normalverteilung ersetzt bei großen Stichproben, also bei relativ hohem n, die Binomialverteilung, wobei dann für die Normalverteilung - so wie bei der Binomalverteilung - wie folgt gilt:
-
Erwartungswert bei großem n: \(\mu =E\left( x \right) = n \cdot p\)
-
Standardabweichung bei großem n: \(\sigma = \sqrt {Var(x)} = \sqrt {n \cdot p \cdot \left( {1 - p} \right)} \)
Hat eine Zufallsvariable X eine Normalverteilung mit beliebigen μ und σ, so kann man die Werte der Normalverteilung mit \(z = \dfrac{{X - \mu }}{\sigma }\) in eine Standardnormalverteilung umrechnen.
Für die tabellarische Ermittlung von z aus \(\gamma\) gibt es 2 Möglichkeiten
- man geht mit dem Wert \(\Phi \left( z \right) = \dfrac{{\gamma + 1}}{2}\) in eine \(\Phi \left( z \right) \Rightarrow z\) Tabelle und liest z ab
- man geht mit dem Wert \(D\left( z \right) = \gamma \) in eine \(D\left( z \right) \Rightarrow z\) Tabelle und liest z ab
D(z) entspricht der Fläche unter der Gaußkurve, zwischen 2 vom Erwartungswert E bzw. μ um \( \pm z \cdot \sigma \) entfernt liegende Grenzen. Für das zugehörige Konfidenzintervall gilt:
\({p_{1,2}} = \mu \pm z \cdot \sigma \Rightarrow \left[ {{p_1},\,\,{p_2}} \right] = \left[ {\mu - \sigma ;\,\,\mu + \sigma } \right]\)
Dichtefunktion f(t) einer Normalverteilung mit \(X \sim N\left( {\mu ,{\sigma ^2}} \right)\)
\(f\left( t \right) = \dfrac{1}{{\sigma \cdot \sqrt {2\pi } }} \cdot {e^{ - \dfrac{1}{2} \cdot {{\left( {\dfrac{{t - \mu }}{\sigma }} \right)}^2}}}\)
-
Die Dichtefunktion der Normalverteilung hat die Form einer Glockenkurve, ist symmetrisch um den Erwartungswert µ, der zugleich ihr Maximum ist. Ihre beiden Wendestellen liegen bei µ-σ bzw. bei µ+σ. Ihr Graph nähert sich asymptotisch der positiven bzw. negativen x-Achse an. Sie illustriert, dass Abweichungen vom Erwartungs- bzw. Mittelwert umso unwahrscheinlicher werden, je weiter die Zufallsvariable X von µ entfernt ist. Um die Dichtefunktion der Normalverteilung zeichnen zu können benötigt man nur den Erwartungswert µ, der die Lage vom Maximum auf der x-Achse bestimmt und die Streuung σ, welche die Breite vom Graph bestimmt.
-
Der Flächeninhalt, der von der Dichtefunktion der Normalverteilung eingeschlossen wird - also das Integral von minus Unendlich bis plus unendlich - ist unabhängig von den Werten von µ und σ immer genau 1.
- Wahrscheinlichkeit, dass die Zufallsvariable X einen Wert kleiner oder gleich einer Grenze G annimmt: \(P(X \le G) = \int\limits_{ - \infty }^G {f\left( t \right)} \,\,dt\)
- Wahrscheinlichkeit, dass die Zufallsvariable X einen Wert größer oder gleich einer unteren Grenze U und gleich oder kleiner einer oberen Grenze O annimmt: \(P(U \le X \le O) = \int\limits_U^O {f\left( t \right)} \,\,dt\)
- Wahrscheinlichkeit, dass die Zufallsvariable X mindestens einen Wert größer oder gleich einer Grenze O annimmt: \(P\left( {X \ge G} \right) = \int\limits_G^\infty {f\left( t \right)} \,\,dt\)
Verteilungsfunktion F(x) einer Normalverteilung
\(F\left( x \right) = \int\limits_{ - \infty }^x {f\left( t \right)\,\,dt} = \dfrac{1}{{\sigma \cdot \sqrt {2\pi } }} \cdot \int\limits_{ - \infty }^x {{e^{ - \dfrac{1}{2} \cdot {{\left( {\dfrac{{t - \mu }}{\sigma }} \right)}^2}}}} \,\,dt\)
- Auf Grund der Symmetrie der Verteilungsfunktion gilt \(F(x) = 1 - F( - x)\)
Anmerkung:
- Bei der Dichtefunktion f(t) lautet das Argument t, bei der Verteilungsfunktion F(x) lautet das Argument x nur um besser zwischen den beiden Funktionen unterscheiden zu können. Das t hat nichts mit Zeit zu tun, es hat sich einfach für die Dichtefunktion so etabliert.
Dichte- und Verteilungsfunktion der Normalverteilung
- Die Verteilungsfunktion - sie hat den Graph einer logistischen Wachstumsfunktion - ist das Integral der Dichtefunktion bzw. die Dichtefunktion ist die Ableitung der Verteilungsfunktion
- Dort wo die Verteilungsfunktion ihren Wendepunkt \(WP\left( {\mu ,0.5} \right)\) hat, dort liegt der Erwartungswert und an dieser Stelle hat die Verteilungsfunktion die Wahrscheinlichkeit 0,5 bzw hat dort die Dichtefunktion ihr Maximum.
- Auf der y-Achse der Verteilungsfunktion kann man die Wahrscheinlichkeit \(P\left( {X \le {x_1}} \right)\) ablesen, höchstens den Wert x1 zu erreichen.
- In unten stehender Illustration beträgt die Wahrscheinlichkeit höchstens den Wert x1 zu erreichen: 0,7 bzw. 70%
- Der verbleibende Rest auf 1 entspricht der Wahrscheinlichkeit mindestens den Wert x1 zu erreichen.
- In unten stehender Illustration beträgt die Wahrscheinlichkeit mindestens den Wert x1 zu erreichen: 0,3 bzw. 30%
Schon den nächsten Urlaub geplant?
Auf maths2mind kostenlos auf Prüfungen vorbereiten!
Nach der Prüfung in Ruhe entspannen
Standardnormalverteilung
Die Normalverteilung oder gaußsche Verteilung ist eine stetige Verteilung und hat den Erwartungswert μ und die Varianz ,σ2 als Parameter. Da die Normalverteilung nur aufwändig zu berechnen ist, hat man sie standardisiert und in Tabellenform gebracht, wobei man den Mittelwert \(\mu = 0\) und die Standardabweichung \(\sigma = 1\) gesetzt hat. Hat eine Zufallsvariable X eine Normalverteilung mit beliebigen \(\mu\) und \(\sigma\) , so kann man die Werte der Normalverteilung mit \(Z = \dfrac{{X - \mu }}{\sigma }\)in eine Standardnormalverteilung umrechnen. Man nennt diese Umrechnung auch z-Transformation. Mit Hilfe der z-Transformation kann jede Normalverteilung standardisiert werden und dadurch viel einfacher (mit Hilfe einer Tabelle) berechnet werden.
- Um bei der Verteilungsfunktion Verwechslungen mit der Normalverteilung zu vermeiden, verwendet man für die Standardnormalverteilung die Bezeichnung \(\Phi \left( z \right)\), statt F(x).
- Um bei der Dichtefunktion Verwechslungen mit der Normalverteilung zu vermeiden, verwendet man für die Standardnormalverteilung die Bezeichnung \(\varphi \left( x \right)\) , statt f(x).
Bei um den Erwartungswert symmetrischen Intervallen gilt folgender Zusammenhang:
\(P\left( { - z \leqslant Z \leqslant z} \right) = 2 \cdot \Phi \left( z \right) - 1\)
\(P\left( { - z \leqslant Z \leqslant z} \right)\) | =90% | =95% | =99% |
z | \( \approx 1,645\) | \( \approx 1,960\) | \( \approx 2,576\) |
Dichtefunktion der Standard Normalverteilung
\(\varphi \left( x \right) = \dfrac{1}{{\sqrt {2\pi } }} \cdot {e^{ - \dfrac{{{x^2}}}{2}}}\)
Verteilungsfunktion der Standard Normalverteilung
Die Verteilungsfunktion der Standard Normalverteilung entspricht dem Integral über die Dichtefunktion
\(\begin{array}{l} \Phi \left( z \right) = P\left( {Z \le z} \right) = \int\limits_{ - \infty }^z {\varphi \left( x \right)} \,\,dx = \dfrac{2}{{\sqrt {2\pi } }} \cdot \int\limits_{ - \infty }^z {{e^{ - \dfrac{{{x^2}}}{2}}}} \,\,dx\\ \Phi \left( { - z} \right) = 1 + \Phi \left( z \right) \end{array}\)
Für den Graph der gaußschen Glockenkurve gilt:
- die Funktion nimmt nur positive Werte an \(p\left( x \right) > 0\) , wird aber für \(x < \mu - 3\sigma \) und \(x > \mu + 3\sigma\) "fast null und sie hat daher an der Basis eine "sichtbar" Breite von \(6\sigma \)
- hat \(\int\limits_{ - \infty }^\infty {f\left( x \right)\,\,dx = 1}\) als Flächeninhalt mit der x-Achse
- je kleiner die Streuung \(\sigma\) umso schmäler und höher ist die Glockenkurve, je größer die Streuung \(\sigma\) um so breiter und flacher ist die Glockenkurve
- hat einen Sattelpunkt an der Stelle \(x = \mu\)
- hat zwei Wendepunkte an den Stellen \(x = \mu \pm \sigma\)
- hat die x-Achse als Asymptote
- ist symmetrisch bezüglich der Geraden \(x = \mu\)
- die Wahrscheinlichkeit dass eine Messung exakt einen Wert a auf der Glockenkurve annimmt ist immer Null. Man erhält nur Aussagen für Intervalle, d.h. man muss eine Messungenauigkeit, einen absoluten Fehler \(\left| {\Delta x} \right|\) mit einbeziehen \(P\left( {a - \left| {\Delta x} \right| \leqslant x \leqslant a + \left| {\Delta x} \right|} \right)\)
Konfidenzintervall für Normal- bzw. Standardnormalverteilung
Bei der Ermittlung statistischer Parameter wie Mittelwert oder Standardabweichung prüft man selten alle möglichen Ergebnisse, sondern man beschränkt sich auf eine Stichprobe. Dadurch ist die Messung aber Ungenauigkeiten unterworfen.
Das Konfidenzintervall definiert einen Bereich, in dem man mit einer bestimmten Wahrscheinlichkeit (dem Konfidenzniveau \(\gamma\)) darauf vertrauen darf, dass sich der wahre Wert einer Zufallsgröße darin befindet. Typische Werte für das Konfidenzniveau liegen bei 90%, 95% oder bei 99%. Umgekehrt kann man die Frage nach dem erforderlichen Stichprobenumfang klären, wenn man ein konkretes Konfidenzintervall vorgibt.
Vereinfachte Merksätze:
- Größere Stichprobe ergibt ein schmäleres Konfidenzintervall (Hochrechnung bei Wahlen: höherer Auszählungsgrad → geringere Schwankungsbreite)
- Größere Sicherheit (höheres Konfidenzniveau = höherer Prozentsatz beim Konfidenzintervall) bedeutet breiteres Konfidenzintervall
- Je näher der Prozentsatz an der 50 % Grenze liegt, umso breiter wird das Konfidenzintervall. Das heißt je deutlicher Zustimmung bzw. Ablehnung sind, umso schmäler wird das Konfidenzintervall
Für diejenigen Werte p, in deren das \(\gamma\) Konfidenzintervall der Wert h liegt, gilt
\({p_{1,2}} = \left[ {h - z \cdot \sqrt {\dfrac{{h \cdot \left( {1 - h} \right)}}{n}} ;\,\,\,\,h + z \cdot \sqrt {\dfrac{{h \cdot \left( {1 - h} \right)}}{n}} } \right]\)
h | relative Häufigkeit in einer Stichprobe |
p | unbekannter relativer Anteil in der Grundgesamtheit |
\(\gamma\) | Konfidenz- / Vertrauensniveau |
n | Umfang der Stichprobe |
z | Ist aus der Tabelle der Standardnormalverteilung abzulesen
Für das 95%-Konfidenzintervall gilt beispielhaft: \(\eqalign{ & 2 \cdot \Phi \left( z \right) - 1 = 0,95 \cr & \Phi \left( z \right) = \dfrac{{1,95}}{2} = 0,975 \cr} \) Aus der Tabelle der Standardnormalverteilung können wir ablesen: \(z\left( {0,975} \right) = 1,96\) |
Illustration zur Veranschaulichung:
Die Fläche unter der gaußschen Glockenkurve und zwischen den Intervallgrenzen p1 bzw. p2 errechnet sich zu \(2\Phi \left( z \right) - 1 = \gamma \).
Das zugehörige z kann man auf 2 Arten aus den entsprechenden Tabellen ermitteln:
- man geht mit dem Wert \(\Phi \left( z \right) = \dfrac{{\gamma + 1}}{2}\) in eine \(\Phi \left( z \right) \Rightarrow z\) Tabelle und liest z ab
- man geht mit dem Wert \(D\left( z \right) = \gamma \) in eine \(D\left( z \right) \Rightarrow z\) Tabelle und liest z ab
α von 5 % bzw. z(0,975)=1,96 bedeutet, dass das Intervall den gesuchten Wert der Grundgesamtheit mit 95 % Wahrscheinlichkeit enthält.
Zweiseitiges (1 – α)-Konfidenz- /Schwankungsintervall für einen Einzelwert einer normalverteilten Zufallsvariablen
\(\left[ {\mu - {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \sigma ;\,\,\,\,\,\mu + {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \sigma } \right]\)
Zweiseitiges (1 – α)-Konfidenz- /Schwankungsintervall für den Stichprobenmittelwert normalverteilter Werte
\(\left[ {\mu - {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{\sigma }{{\sqrt n }};\,\,\,\,\,\mu + {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \sigma \cdot \dfrac{\sigma }{{\sqrt n }}} \right]\)
Zweiseitiges (1– α)-Konfidenz- /Schwankungsintervall für den Erwartungswert einer normalverteilten Zufallsvariablen bei bekanntem σ und bekanntem Mittelwert der Zufallsstichprobe
\(\left[ {\overline x - {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{\sigma }{{\sqrt n }};\,\,\,\,\,\overline x + {z_{1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{\sigma }{{\sqrt n }}} \right]\)
\(\overline x\) | Stichprobenmittelwert |
\({s_{\overline x }} = {s_{n - 1}}\) | Standardabweichung einer Stichprobe |
n | Stichprobenumfang |
\({z_{1\, - \,\dfrac{\alpha }{2}}}\) |
\(\left( {1 - \dfrac{\alpha }{2}} \right)\)- Quantil der Standardnormalverteilung, wobei: \(\begin{array}{l} P\left( { - z \le Z \le z} \right) = 90\% \to z = 1,654\\ P\left( { - z \le Z \le z} \right) = 95\% \to z = 1,960\\ P\left( { - z \le Z \le z} \right) = 99\% \to z = 2,576 \end{array}\) |
Konfidenzintervall für die studentsche t-Verteilung
Wenn die Standardabweichung σ der Grundgesamtheit unbekannt ist, man aber die Standardabweichung s der Stichprobe kennt und man nur einen kleinen Stichprobenumfang hat, benützt man anstelle der Normalverteilung die (studentsche) t-Verteilung.
Die Grundgesamtheit muss dabei (annähernd) normalverteilt sein. Die t-Verteilung hat ein glockenförmiges Aussehen, die Fläche unter der Glocke ist 1 und sie ist symmetrisch um Null. Median, Modus und Mittelwert sind null.
- Der 1. Parameter der t-Verteilung ist deren Freiheitsgrad f, der sich zu f=n-1 ergibt.
- Stichprobenumfang n=8 → f=8-1=7
- Der 2. Parameter ergibt sich gemäß \(\left( {1 - \dfrac{\alpha }{2}} \right)\)
- zweiseitiger 95% Vertrauensbereich: \(\alpha = 5\% \overset{\wedge}\to{=} 0,05 \to 1 - \frac{{0,05}}{2} = 0,975\)
Mit den beiden Werten geht geht man in die t-Tabelle und liest wie folgt ab: \({t_{7;0,975}} \approx 2,3646{\text{ }}\)
Zweiseitiges (1– α)- Konfidenz- /Schwankungsintervall für den Erwartungswert einer normalverteilten Zufallsvariablen bei unbekanntem σ
\(\left[ {\overline x - {t_{f;\,\,1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{{{s_{n - 1}}}}{{\sqrt n }};\,\,\,\,\,\overline x + {t_{f;\,\,1\, - \,\dfrac{\alpha }{2}}} \cdot \dfrac{{{s_{n - 1}}}}{{\sqrt n }}} \right]\)
mit
\({t_{f;\,\,\,1\, - \,\dfrac{\alpha }{2}}}\) | \(\left( {1 - \dfrac{\alpha }{2}} \right)\)- Quantil der t-Verteilung mit f Freiheitsgraden |
α von 5 % (bei der Normalverteilung: z(0,975)=1,96) bedeutet, dass das Intervall den gesuchten Wert der Grundgesamtheit mit 95 % Wahrscheinlichkeit enthält. \({\dfrac{\alpha }{2}}\buildrel \wedge \over =2,5% \) der Werte liegen links vom Intervall und \({\dfrac{\alpha }{2}}\buildrel \wedge \over =2,5% \) der Werte liegen rechts vom Intervall.
Die Berechnung des Konfidenzintervalls kann z.B. mit dem Wahrscheinlichkeitsrechner von GeoGebra erfolgen:
Wahrscheinlichkeitsrechner
- Statistik
- T-Schätzung eines Mittelwerts
- Eingabe von 4 Werten erforderlich:
- Konfidenzniveau:
- Mittelwert der Stichprobe:
- Standardabweichung s der Stichprobe:
- Größe n der Stichprobe
- Eingabe von 4 Werten erforderlich:
- T-Schätzung eines Mittelwerts
Standardnormalverteilung Tabelle Phi von z
Werte der Verteilungsfunktion \(\Phi \left( z \right) = P\left( {Z \leqslant z} \right){\text{ mit }}z \geqslant 0\)
- Ablesebeispiel: \(\Phi \left( {1,55} \right) = \Phi \left( {1,5 + 0,05} \right) = 0,9394\)
- Funktionswerte für negative Argumente: \(\Phi \left( { - z} \right) = 1 - \Phi \left( z \right)\)
- Ablesebeispiel für z-Quantile: \(z\left( {0,9394} \right) = 1,55\) Ablesebeispiel ist grün eingezeichnet
z-Quantile
z-Quantile sind statistische Maße, die in der Wahrscheinlichkeitsverteilung einer Standardnormalverteilung verwendet werden. Die Standardnormalverteilung hat einen Mittelwert von 0 und eine Standardabweichung von 1.
Z-Quantile geben an, an welcher Stelle in der Verteilung sich ein bestimmter Prozentsatz der Daten befindet. Ein Z-Quantil ist ein Wert, der angibt, wie viele Standardabweichungen ein bestimmter Wert von der durchschnittlichen Verteilung entfernt ist. Zum Beispiel entspricht das Z-Quantil 1 einem Wert, der eine Standardabweichung über dem Durchschnitt liegt, während das Z-Quantil -1 einem Wert entspricht, der eine Standardabweichung unter dem Durchschnitt liegt.
Die Z-Quantile werden häufig verwendet, um Signifikanzniveaus in der Statistik zu bestimmen. Zum Beispiel entspricht das Z-Quantil 1,55 dem 93,94 Perzentil, was bedeutet, dass 93,94 Prozent der Daten unterhalb dieses Wertes liegen.
0,00 | 0,01 | 0,02 | 0,03 | 0,04 | 0,05 | 0,06 | 0,07 | 0,08 | 0,09 | |
0,0 | 0,5000 | 0,5040 | 0,5080 | 0,5120 | 0,5160 | 0,5199 | 0,5239 | 0,5279 | 0,5319 | 0,5359 |
0,1 | 0,5398 | 0,5438 | 0,5478 | 0,5517 | 0,5557 | 0,5596 | 0,5636 | 0,5675 | 0,5714 | 0,5753 |
0,2 | 0,5793 | 0,5832 | 0,5871 | 0,5910 | 0,5948 | 0,5987 | 0,6026 | 0,6064 | 0,6103 | 0,6141 |
0,3 | 0,6179 | 0,6217 | 0,6255 | 0,6293 | 0,6331 | 0,6368 | 0,6406 | 0,6443 | 0,6480 | 0,6517 |
0,4 | 0,6554 | 0,6591 | 0,6628 | 0,6664 | 0,6700 | 0,6736 | 0,6772 | 0,6808 | 0,6844 | 0,6879 |
0,5 | 0,6915 | 0,6950 | 0,6985 | 0,7019 | 0,7054 | 0,7088 | 0,7123 | 0,7157 | 0,7190 | 0,7224 |
0,6 | 0,7257 | 0,7291 | 0,7324 | 0,7357 | 0,7389 | 0,7422 | 0,7454 | 0,7486 | 0,7517 | 0,7549 |
0,7 | 0,7580 | 0,7611 | 0,7642 | 0,7673 | 0,7704 | 0,7734 | 0,7764 | 0,7794 | 0,7823 | 0,7852 |
0,8 | 0,7881 | 0,7910 | 0,7939 | 0,7967 | 0,7995 | 0,8023 | 0,8051 | 0,8078 | 0,8106 | 0,8133 |
0,9 | 0,8159 | 0,8186 | 0,8212 | 0,8238 | 0,8264 | 0,8289 | 0,8315 | 0,8340 | 0,8365 | 0,8389 |
0,00 | 0,01 | 0,02 | 0,03 | 0,04 | 0,05 | 0,06 | 0,07 | 0,08 | 0,09 | |
1,0 | 0,8413 | 0,8438 | 0,8461 | 0,8485 | 0,8508 | 0,8531 | 0,8554 | 0,8577 | 0,8599 | 0,8621 |
1,1 | 0,8643 | 0,8665 | 0,8683 | 0,8708 | 0,8729 | 0,8749 | 0,8770 | 0,8790 | 0,8810 | 0,8830 |
1,2 | 0,8849 | 0,8869 | 0,8888 | 0,8907 | 0,8925 | 0,8944 | 0,8962 | 0,8980 | 0,8997 | 0,9015 |
1,3 | 0,9032 | 0,9049 | 0,9066 | 0,9082 | 0,9099 | 0,9115 | 0,9131 | 0,9147 | 0,9162 | 0,9177 |
1,4 | 0,9192 | 0,9207 | 0,9222 | 0,9236 | 0,9251 | 0,9265 | 0,9279 | 0,9292 | 0,9306 | 0,9319 |
1,5 | 0,9332 | 0,9345 | 0,9357 | 0,9370 | 0,9382 | 0,9394 | 0,9406 | 0,9418 | 0,9429 | 0,9441 |
1,6 | 0,9452 | 0,9463 | 0,9474 | 0,9484 | 0,9495 | 0,9505 | 0,9515 | 0,9525 | 0,9535 | 0,9545 |
1,7 | 0,9554 | 0,9564 | 0,9573 | 0,9582 | 0,9591 | 0,9599 | 0,9608 | 0,9616 | 0,9625 | 0,9633 |
1,8 | 0,9648 | 0,9649 | 0,9656 | 0,9664 | 0,9671 | 0,9678 | 0,9686 | 0,9693 | 0,9699 | 0,9706 |
1,9 | 0,9713 | 0,9719 | 0,9726 | 0,9732 | 0,9738 | 0,9744 | 0,9750 | 0,9756 | 0,9761 | 0,9767 |
0,00 | 0,01 | 0,02 | 0,03 | 0,04 | 0,05 | 0,06 | 0,07 | 0,08 | 0,09 | |
2,0 | 0,9772 | 0,9778 | 0,9783 | 0,9788 | 0,9793 | 0,9798 | 0,9803 | 0,9808 | 0,9812 | 0,9817 |
2,1 | 0,9821 | 0,9826 | 0,9830 | 0,9834 | 0,9838 | 0,9842 | 0,9846 | 0,9850 | 0,9854 | 0,9853 |
2,2 | 0,9861 | 0,9864 | 0,9868 | 0,9871 | 0,9875 | 0,9878 | 0,9881 | 0,9884 | 0,9887 | 0,9890 |
2,3 | 0,9893 | 0,9896 | 0,9898 | 0,9901 | 0,9904 | 0,9906 | 0,9909 | 0,9911 | 0,9913 | 0,9916 |
2,4 | 0,9918 | 0,9920 | 0,9922 | 0,9925 | 0,9927 | 0,9929 | 0,9931 | 0,9932 | 0,9934 | 0,9936 |
2,5 | 0,9938 | 0,9940 | 0,9941 | 0,9943 | 0,9945 | 0,9946 | 0,9948 | 0,9949 | 0,9951 | 0,9952 |
2,6 | 0,9953 | 0,9955 | 0,9956 | 0,9957 | 0,9959 | 0,9960 | 0,9961 | 0,9962 | 0,9963 | 0,9964 |
2,7 | 0,9965 | 0,9966 | 0,9967 | 0,9968 | 0,9969 | 0,9970 | 0,9971 | 0,9972 | 0,9973 | 0,9974 |
2,8 | 0,9974 | 0,9975 | 0,9976 | 0,9977 | 0,9977 | 0,9978 | 0,9979 | 0,9979 | 0,9980 | 0,9981 |
2,9 | 0,9981 | 0,9982 | 0,9982 | 0,9983 | 0,9984 | 0,9984 | 0,9985 | 0,9985 | 0,9986 | 0,9986 |
0,00 | 0,01 | 0,02 | 0,03 | 0,04 | 0,05 | 0,06 | 0,07 | 0,08 | 0,09 | |
3,0 | 0,9987 | 0,9987 | 0,9987 | 0,9988 | 0,9988 | 0,9989 | 0,9989 | 0,9989 | 0,9990 | 0,9990 |
3,1 | 0,9990 | 0,9991 | 0,9991 | 0,9991 | 0,9992 | 0,9992 | 0,9992 | 0,9992 | 0,9993 | 0,9993 |
3,2 | 0,9993 | 0,9993 | 0,9994 | 0,9994 | 0,9994 | 0,9994 | 0,9994 | 0,9995 | 0,9995 | 0,9995 |
3,3 | 0,9995 | 0,9995 | 0,9995 | 0,9996 | 0,9996 | 0,9996 | 0,9996 | 0,9996 | 0,9996 | 0,9997 |
3,4 | 0,9997 | 0,9997 | 0,9997 | 0,9997 | 0,9997 | 0,9997 | 0,9997 | 0,9997 | 0,9997 | 0,9998 |
3,5 | 0,9998 | 0,9998 | 0,9998 | 0,9998 | 0,9998 | 0,9998 | 0,9998 | 0,9998 | 0,9998 | 0,9998 |
3,6 | 0,9998 | 0,9998 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 |
3,7 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 |
3,8 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 | 0,9999 |
3,9 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | 1,0000 |