Gleichverteilung - Disparität - Konzentration
Formel
Gleichverteilung - Disparität - Konzentration
Von Gleichverteilung spricht man, wenn jeder Merkmalsträger den gleichen Anteil an der Merkmalssumme auf sich vereint.
Disparität und Konzentration sind Maße für die Ungleichheit bei der Verteilung der Merkmalsumme auf einzelne Merkmalsträger.
- Eine hohe Disparität liegt dann vor, wen ein kleiner %-Anteil der Merkmalsträger einen hohen Anteil an der Merkmalssumme hat. Z.B. welchen Anteil am Gesamteinkommen der Bevölkerung eines Landes die 10% der Reichsten auf sich vereinen.
- Eine hohe Konzentration liegt vor, wenn eine kleine Anzahl an Merkmalsträgern einen hohen Anteil der Merkmalssumme hat. Z.B. welchen Anteil am Gesamteinkommen der Bevölkerung eines Landes die 10.000 der Reichsten auf sich vereinen.
Lorenzkurve
Die Lorenz Kurve ist ein grafisches Maß für die Disparität. Die Fläche zwischen der Lorentzkurve und der Diagonalen (Gerade der Gleichverteilung) wird als Lorentzfläche bezeichnet.
\(Lorenz-Fläche = \dfrac{{n - 1}}{{2n}} - \dfrac{1}{n} \cdot \sum\limits_{i = 1}^{n - 1} {{v_i}} \)
Die Lorentzkurve ist eine graphische Darstellung von Ungleichheiten in der Verteilung von Merkmalsträger (x-Achse, Anteil der Bevölkerung) und zugehöriger Merkmalssumme (y-Achse, Anteil am Einkommen). Die Lorentzkurve geht immer durch die Punkte \(\left( {0\left| 0 \right.} \right)\) und \(\left( {100\left| 100 \right.} \right)\)der Gleichverteilung. Die Ungleichheit kann aus der Abweichung von der Verbindung der Punkte \(\left( {0\left| 0 \right.} \right)\) und \(\left( {100\left| 100 \right.} \right)\) abgelesen werden. Je weiter entfernt, um so ungleicher.
Die Lorentzkurve ist der Streckenzug durch die Punkte \(\left( {0\left| 0 \right.} \right)\), \(\left( {{u_1}\left| {{v_1}} \right.} \right)...\left( {{u_n}\left| {{v_n}} \right.} \right)\) und \(\left( {1\left| 1 \right.} \right)\) mit den summierten Anteilen \({u_j} = \dfrac{j}{n}\) und \({v_j} = \dfrac{{\sum\limits_{i = 1}^j {{x_i}} }}{{\sum\limits_{i = 1}^n {{x_i}} }}\) auf der y-Achse.
Gini-Koeffizient
Der Gini-Koeffizient ist eine Zahl, die der Fläche unter der Gleichverteilungsgeraden und der Lorentzkurve entspricht. Je weiter die Lorentzkurve unter der Gleichverteilungsgeraden liegt, umso größer ist die Fläche, umso ungerechter ist die Verteilung (Disparität) und um so größer ist der Gini-Koeffizient.
\(G = 1 - \dfrac{2}{n} \cdot \left( {\sum\limits_{i = 1}^n {{L_i} - 0,5} } \right)\) | Li ... kumulierte Anteile an der Merkmalsumme |
\(G = 2\int\limits_0^1 {\left( {x - L\left( x \right)} \right)} \,\,dx\) | L(x) ... Lorentzfunktion |
Mathematisch ist der Gini-Koeffizient G der dimensionslose Quotient zweier Flächen. G=(Fläche zwischen der Gleichverteilungsgeraden und der Lorentzkurve) in Relation zur darunter liegenden (Dreiecksfläche zwischen der Gleichverteilungsgeraden und der x-Achse).
- G=0 entspricht einer Gleichverteilung, also fehlender Konzentration bzw. fehlender Disparität.
- \(G \to 1\) entspricht „Einer oder Wenige besitzen fast alles, also hoher Konzentration bzw. hoher Dispersität.
Ein Gini-Koeffizient alleine macht keine Aussagen, denn es gibt kein absolutes Maß dafür, ab wann eine Verteilung „unfair“ wird. Man kann aber mit dem Gini-Koeffizient unterschiedliche Verteilungen einander gegenüberstellen.
Schon den nächsten Urlaub geplant?
Auf maths2mind kostenlos auf Prüfungen vorbereiten!
Nach der Prüfung mit dem gesparten Geld deinen Erfolg genießen.
Wissenspfad
Zur aktuellen Lerneinheit empfohlenes Vorwissen
Schließende Statistik | Die schließende Statistik ermöglicht es von einer (kleinen) Stichprobe auf die (große) Grundgesamtheit G zu schließen. Die Stichprobe ist eine repräsentative Teilmenge, die der Grundgesamtheit zufällig entnommen wurde. Die Wahrscheinlichkeitsrechnung wertet die Ergebnisse von Zufallsexperimenten aus. |
Aktuelle Lerneinheit
Gleichverteilung - Disparität - Konzentration | Von Gleichverteilung spricht man, wenn jeder Merkmalsträger den gleichen Anteil an der Merkmalssumme auf sich vereint. |
Verbreitere dein Wissen zur aktuellen Lerneinheit
Standardnormalverteilung | Unter der Standardnormalverteilung versteht man die mit μ=0 und σ=1 standardisierte Normalverteilung. Mit Hilfe der z-Transformation rechnet man beliebige Erwartungswerte bzw. Standardabweichungen auf die Standardnormalverteilung um. |
Konfidenzintervall | Bei der Ermittlung statistischer Parameter prüft man selten alle möglichen Ergebnisse, sondern man beschränkt sich auf eine Stichprobe. Dadurch ist die Messung aber Ungenauigkeiten unterworfen. Konfidenzintervalle definieren einen Bereich, in dem man mit einer bestimmten Wahrscheinlichkeit darauf vertrauen darf, dass sich der wahre Wert darin befindet. |
Gedächtnislosigkeit der Exponentialverteilung und der geometrischen Verteilung | Sie gibt die Wahrscheinlichkeit an, dass ein Ereignis (zB ein Produktfehler) nach weiteren t Minuten eintritt, nachdem man schon s Minuten gewartet hat. Man spricht auch von der "Nichtalterungseigenschaft". |
Exponentialverteilung | Die Exponetialfunktion wird zur Modellierung von der Zeit zwischen 2 Ereignissen oder der Lebensdauer von Bauteilen verwendet. |
Rechteckverteilung | Die Rechteckverteilung im Intervall [a, b] ist eine stetige Gleichverteilung, bei der jedes Ergebnis gleich wahrscheinlich ist. |
Normalverteilung | Die Normalverteilung, auch gaußsche-Glockenverteilung genannt, ist zusammen mit ihrem Spezialfall der Standardnormalverteilung die wichtigste Verteilungsfunktion. |
Hypergeometrische Verteilung | Die hypergeometrische Verteilung ist eine diskrete Verteilung. Die Grundgesamtheit vermindert sich aber bei jeder Wiederholungen, denn es handelt sich um ein „Ziehen ohne Zurücklegen“. |
Poissonverteilung | Die Poissonverteilung ist eine diskrete Verteilung. Sie ist ein Grenzfall der Binomialverteilung wenn n sehr groß (größer 100) ist, verbunden mit einer sehr kleinen Erfolgswahrscheinlichkeit die gegen Null konvergiert |
Bernoulli-Verteilung | Die Bernoulli-Verteilung ist die einfachste diskrete Verteilung. Sie entsteht, wenn man ein Bernoulli Experiment (welches nur 2 mögliche Ausgänge hat) genau 1 Mal ausführt. Die Bernoulli Verteilung ist daher ein Spezialfall der Binomialverteilung für n=1. |
Histogramm der Häufigkeitsverteilung | Histogramme schauen ähnlich aus wie Balkendiagramme - man benötigt zu deren grafischer Darstellung die jeweilige Balkenbreite (Klassenbreite) und die Balkenhöhe (=relativer / prozentueller Anteil der Messwerte) |
Stetige Zufallsvariable | Man spricht von einer stetigen Zufallsvariablen, wenn die Anzahl der Ergebnisse des Zufallsexperiments unendlich, also nicht abzählbar, ist. |
Diskrete Zufallsvariable | Für diskrete Zufallsvariablen ist die Anzahl der Ergebnisse eines Zufallsexperiments endlich, also abzählbar. Sie wird durch eine Wahrscheinlichkeitsfunktion beschrieben. |
Zufallsvariable | Eine Zufallsvariable X ordnet jedem Ergebnis ω vom Ergebnisraum Ω eines Zufallsexperiments eine reelle Zahl x zu. |
Einstufige Zufallsexperimente und deren Wahrscheinlichkeiten | Ein Zufallsexperiment ist ein grundsätzlich beliebig oft wiederholbarer "Versuch", welcher unter identischen Bedingungen zu 2 oder mehreren nicht vorhersagbaren Ergebnissen führt. Wir unterscheiden zwischen Bernoulli und Laplace Experiment. |