Erklärung, Beschreibung und Bedeutung über SchĂ€tzen und Testen

SchĂ€tzen und Testen Bedeutung, Erklärung und Definition.

Mit Hilfe SchĂ€tzen und Testen möchte man Informationen ĂŒber eine unbekannte statistische Grundgesamtheit erhalten.

Table of contents
1 Konzept
2 SchÀtzfunktion
3 Konfidenzintervall
4 Hypothesentest

Konzept

Man interessiert sich fĂŒr Wahrscheinlichkeitsverteilung und Parameter einer Zufallsvariablen. Die Menge aller Realisationen dieser Zufallsvariablen wird Grundgesamtheit genannt.

Grundgesamtheit bekannt

Kann diese Grundgesamheit vollstĂ€ndig beobachtet werden, liefert sie die gewĂŒnschten Informationen.

Beispiel

In einer Urne sind fĂŒnf rote und vier blaue Kugeln. Es werden drei Kugeln ohne ZurĂŒcklegen aus dieser Urne gezogen. Definiert man die Zufallsvariable X: Zahl der roten Kugeln unter den drei gezogenen, ist X hypergeometrisch verteilt mit M=5 als Zahl der roten Kugeln in der Urne, N=9 als Gesamtzahl der Kugeln in der Urne und n=3 als Zahl der Versuche. Hier können alle Informationen ĂŒber die Verteilung von X gewonnen werden.

Grundgesamtheit unbekannt

In den meisten FĂ€llen kann jedoch die Grundgesamtheit nicht vollstĂ€ndig beobachtet werden, weil sie zu groß ist. Interessiert man sich etwa fĂŒr die mittlere GrĂ¶ĂŸe eines 18jĂ€hrigen Knaben in der EU, mĂŒsste man alle 18jĂ€hrigen messen, was praktisch undurchfĂŒhrbar ist. In diesem Sinne könnte man das Urnenbeispiel von oben etwa so abwandeln:

Beispiel

Ein Lebensmittelgroßmarkt bekommt eine Lieferung von 2000 GlĂ€sern mit Pflaumenkompott. Problematisch sind in den FrĂŒchten verbliebene Kerne. Der Kunde toleriert einen Anteil von GlĂ€sern mit Kernen von 5%. Er möchte sich bei dieser Lieferung vergewissern, dass diese Quote nicht ĂŒberschritten wird. Eine komplette Erhebung der Grundgesamtheit von 2000 GlĂ€sern ist allerdings nicht durchfĂŒhrbar, denn 2000 GlĂ€ser zu kontrollieren ist zu aufwendig und außerdem zerstört das Öffnen eines Glases die Ware.

Allerdings könnte man eine kleine Zahl von GlĂ€sern zufĂ€llig aussuchen, also eine Stichprobe nehmen, und die Zahl der zu beanstandenden GlĂ€ser zĂ€hlen. Übersteigt die Zahl eine bestimmte Grenze, den kritischen Wert der PrĂŒfgrĂ¶ĂŸe, geht man davon aus, dass auch in der Lieferung zu viele zu beanstandende GlĂ€ser sind. Man hofft, dass die Stichprobe die Grundgesamtheit widerspiegelt. Geht die Lieferung deswegen zurĂŒck, besteht die Möglichkeit, dass die Entscheidung richtig war, dass also zu viele GlĂ€ser mit Kernen in der Lieferung sind, aber es kann auch die Stichprobe untypisch ausgefallen sein und man lehnt die Lieferung fĂ€lschlicherweise ab.

Ist die Grundgesamtheit einer Zufallsvariablen unbekannt, nimmt man eine Stichprobe: Man wĂ€hlt n viele Elemente zufĂ€llig aus der Grundgesamtheit aus. Mit Hilfe dieser Stichprobenelemente schĂ€tzt man den unbekannten Parameter der Grundgesamtheit. Diese SchĂ€tzung wird als SchĂ€tzfunktion bezeichnet. Da jede Stichprobe aufgrund der ZufĂ€lligkeit anders ausfĂ€llt, sind auch diese SchĂ€tzfunktionen Zufallsvariablen, deren Verteilung von der Verteilung des Merkmals in der Grundgesamtheit abhĂ€ngt. Mit Hilfe dieser Verteilung kann man Wahrscheinlichkeiten fĂŒr Intervalle angeben, in denen sich mit grĂ¶ĂŸter Wahrscheinlichkeit der wahre Parameter befindet, oder man testet, ob eine bestimmte Vermutung, eine Hypothese, ĂŒber den Parameter bestĂ€tigt werden kann.

SchÀtzfunktion

Man betrachtet ein quantitatives statistisches Merkmal x. Modelltheoretisch wird dieses Merkmal idealisiert: Man geht davon aus, dass es sich in Wahrheit um eine Zufallsvariable X handelt, deren tatsĂ€chliche, „wahre“ Verteilung und „wahre“ Verteilungsparameter unbekannt sind. Man nennt dies die Grundgesamtheit des Merkmals.

Diese Informationen erhofft man sich durch eine Stichprobe: Man entnimmt der Grundgesamtheit zufÀllig n viele Elemente. Mit Hilfe dieser Stichprobenelemente schÀtzt man dann die Parameter.

Definition der SchÀtzfunktion

Um einen Parameter γ einer Verteilung zu schÀtzen, nimmt man aus der Grundgesamtheit eine uneingeschrÀnkte Zufallsstichprobe vom Umfang n, es werden also n Realisationen xi (i = 1, ... , n) der Zufallsvariablen X beobachtet. Man fasst die n Realisationen wahrscheinlichkeitstheoretisch als unabhÀngige Folge von n Zufallsvariablen Xi auf. Um den Parameter γ zu schÀtzen, werden die Xi in geeigneter Weise zusammengefasst. Sie bilden eine SchÀtzfunktion g(X1, X2, ..., Xn) oder Stichprobenfunktion. Da die Stichprobe zufÀllig erfolgt, ist die SchÀtzfunktion wiederum eine Zufallsvariable.

AusgewÀhlte SchÀtzfunktionen

Metrisches Merkmal

Der Erwartungswert wird mit dem arithmetischen Mittel der Stichprobe geschÀtzt,

.

Ist die Verteilung symmetrisch, kann auch der Median der Stichprobe als SchĂ€tzer fĂŒr den Erwartungswert verwendet werden:

,

wobei die Position des Medians in der Mitte einer der GrĂ¶ĂŸe nach geordneten Liste bezeichnet.

FĂŒr die Varianz der Grundgesamtheit verwendet man die Stichprobenvarianz als SchĂ€tzfunktion

.

Die Verteilung der SchÀtzfunktionen hÀngt von der Verteilung des Merkmals in der Grundgesamtheit ab.

Das Merkmal ist normalverteilt mit Erwartungswert ÎŒ und Varianz σ 2:

Es ist als lineare Transformation der Xi der SchÀtzer normalverteilt,

.

Der VarianzschĂ€tzer S2 enthĂ€lt eine Quadratsumme von bezĂŒglich zentrierten normalverteilten Zufallsvariablen. Deshalb ist der Ausdruck

zentral χ2-verteilt mit n-1 Freiheitsgraden.

Ist die Verteilung des Merkmal unbekannt, kann bei genĂŒgend großem Stichprobenumfang die Verteilung der SchĂ€tzfunktion nĂ€herungsweise mit der Normalverteilung angegeben werden.

Dichotome Grundgesamtheit

Man betrachtet hier das Urnenmodell mit zwei Sorten Kugeln. Es soll der Anteilswert der Kugeln erster Sorte in der Grundgesamtheit geschÀtzt werden. Als SchÀtzfunktion verwendet man den Anteil der Kugeln erster Sorte in der Stichprobe,

mit X: Zahl der Kugeln erster Sorte in der Stichprobe. Die Verteilung von P ist die gleiche wie die der entsprechenden Zufallsvariablen X, also eine Binomialverteilung im Modell mit ZurĂŒcklegen und eine hypergeometrische Verteilung im Modell ohne ZurĂŒcklegen.

WĂŒnschenswerte Eigenschaften von SchĂ€tzfunktionen

Konsistenz

Die SchÀtzfunktion soll konsistent sein.

Konsistenz, mit einfachen Worten, besagt, dass sich die SchÀtzfunktion mit wachsendem n immer mehr dem wahren Parameter γ nÀhert.

Die formale Definition lautet:

Eine SchĂ€tzfunktion ist konsistent, wenn fĂŒr jedes Δ>0 gilt:

.

mit gn. = g(X1, X2, ..., Xn).

Man spricht hier von stochastischer Konvergenz.

Erwartungstreue

Die SchÀtzfunktion soll im Mittel gleich dem wahren Parameter γ sein:

Weicht Eg systematisch von Îł ab, ist der SchĂ€tzer verzerrt (“biased“). Die Verzerrung b ist

.

Minimale Varianz

Die SchÀtzfunktion soll eine möglichst kleine Varianz haben. Die SchÀtzfunktion g* aus allen erwartungstreuen SchÀtzfunktionen gk , die die kleinste Varianz hat, wird als beste oder wirksamste SchÀtzfunktion bezeichnet.

Weitere Stichworte

Beispiel

Die AusfĂŒhrungen sollen zum besseren VerstĂ€ndnis anhand eines (frei erfundenen) Beispiels erlĂ€utert werden.

In einem privat betriebenen medizinischen Labor ist eine neue Methode zur Vermehrung von Gewebezellen entwickelt worden. Dieses Gewebe soll vor allem bei großflĂ€chigen Verbrennungen auf die beschĂ€digte Haut transplantiert werden. Um weiter planen zu können, braucht man nĂ€here Informationen ĂŒber die Schnelligkeit des Zellwachstums. Man interessiert sich fĂŒr die Frage: “Wie schwer ist ein Zellklumpen bestimmten Gewichts nach vier Wochen Zucht?“.

Man definiert nun die Zufallsvariable X: Gewicht eines Zellklumpens [g]. Da es sich dabei um ein natĂŒrliches PhĂ€nomen handelt, kann man nach dem zentralen Grenzwertsatz vermuten, dass X normalverteilt ist. Es geht nun aber darum, Informationen ĂŒber die Parameter der Verteilung zu erhalten: Wie schwer ist so ein Zellklumpen im Mittel und wie sehr schwanken die einzelnen Gewichte? Man sucht Informationen ĂŒber den Erwartungswert und die Varianz der Zufallsvariablen.

TatsĂ€chlich ist das Gewicht eines Zellklumpens normalverteilt mit dem Erwartungwert ÎŒ = 10 [g] und der Varianz σ2 = 4 [g2]. Diese "wahren" Parameter regieren also die Stichprobe, sie sind den Laborbetreibern aber unbekannt.

Ergebnis des iten Röhrchens x1 x2 x3 x4 x5
Gewicht der Zellen x 7,4 9,4 10,2 9,6 11,7

Man kann nun den Erwartungswert schÀtzen, z.B. mit dem arithmetischen Mittel als SchÀtzfunktion g1,

Da jede Stichprobe vom Umfang 5 anders ausfallen kann, ist das Mittel selbst eine Zufallsvariable.

Es wĂ€re aber als SchĂ€tzer g2 fĂŒr ÎŒ auch der Median z denkbar. Es ist der drittgrĂ¶ĂŸte Wert:

Zur Veranschaulichung wurde 1000 mal eine solche Stichprobe per Zufallszahlen erzeugt. Die ersten 18 Stichproben werden in der unten folgenden Tabelle gezeigt. Die ersten fĂŒnf Spalten zeigen die einzelnen Ergebnisse, dann folgen einige SchĂ€tzfunktionen.

Man sieht, dass beispielsweise der arithmetische Mittelwert von 7 bis 11,2 schwankt. Auch die Mediane variieren stark.

Wir könnten noch weitere SchĂ€tzfunktionen fĂŒr ÎŒ vorschlagen, etwa

den Durchschnitt zwischen der kleinsten und grĂ¶ĂŸten Beobachtung, oder

Welche SchÀtzfunktion soll man nun verwenden? Ein Kriterium ist die Erwartungstreue. Erwartungstreu sind vermutlich das arithmetische Mittel und der Median, aber auch die SchÀtzfunktion g3. g4 ist offensichtlich Unsinn, wie auch ein Blick auf die Tabelle zeigt.

Aus den drei akzeptablen SchÀtzfunktionen wird nun die mit der kleinsten Varianz ausgewÀhlt, denn da ist der SchÀtzwert am verlÀsslichsten. Man kann zeigen, dass das arithmetische Mittel die kleinste Varianz hat. ist also ein bester SchÀtzer.

Die nÀchste Tabelle zeigt die Durchschnitte der vier SchÀtzfunktionen und auch ihre Varianz.

SchĂ€tzfunktion fĂŒr ÎŒ Arithmetisches Mittel Median ((min(x) + max(x))/2 Wurzel(x1)
Mittelwert der 1000 SchÀtzer 10,00 9,97 10,02 3,15
Varianz der 1000 SchÀtzer 0,79 1,22 1,01 0,10
.

Das Labor schÀtzt also den Erwartungswert mit 9,7 und die Varianz mit

Konfidenzintervall

Siehe auch

Hypothesentest

Siehe


Diese Seite ist ein Artikel über SchĂ€tzen und Testen. Seite Versuche, zum von von Beschreibung über bereitzustellen SchĂ€tzen und Testen. Sie konnten Tatsachen über auch finden SchĂ€tzen und Testen. Erklärung von SchĂ€tzen und Testen.

Suche Alle