SchĂ€tzen und Testen Bedeutung, Erklärung und Definition.
Mit Hilfe SchĂ€tzen und Testen möchte man Informationen ĂŒber eine unbekannte statistische Grundgesamtheit erhalten.
Man interessiert sich fĂŒr Wahrscheinlichkeitsverteilung und Parameter einer Zufallsvariablen. Die Menge aller Realisationen dieser Zufallsvariablen wird Grundgesamtheit genannt.
Kann diese Grundgesamheit vollstĂ€ndig beobachtet werden, liefert sie die gewĂŒnschten Informationen.
Beispiel
In einer Urne sind fĂŒnf rote und vier blaue Kugeln. Es werden drei Kugeln ohne ZurĂŒcklegen aus dieser Urne gezogen. Definiert man die Zufallsvariable X: Zahl der roten Kugeln unter den drei gezogenen, ist X hypergeometrisch verteilt mit M=5 als Zahl der roten Kugeln in der Urne, N=9 als Gesamtzahl der Kugeln in der Urne und n=3 als Zahl der Versuche. Hier können alle Informationen ĂŒber die Verteilung von X gewonnen werden.
In den meisten FĂ€llen kann jedoch die Grundgesamtheit nicht vollstĂ€ndig beobachtet werden, weil sie zu groĂ ist. Interessiert man sich etwa fĂŒr die mittlere GröĂe eines 18jĂ€hrigen Knaben in der EU, mĂŒsste man alle 18jĂ€hrigen messen, was praktisch undurchfĂŒhrbar ist. In diesem Sinne könnte man das Urnenbeispiel von oben etwa so abwandeln:
Beispiel
Ein LebensmittelgroĂmarkt bekommt eine Lieferung von 2000 GlĂ€sern mit Pflaumenkompott. Problematisch sind in den FrĂŒchten verbliebene Kerne. Der Kunde toleriert einen Anteil von GlĂ€sern mit Kernen von 5%. Er möchte sich bei dieser Lieferung vergewissern, dass diese Quote nicht ĂŒberschritten wird. Eine komplette Erhebung der Grundgesamtheit von 2000 GlĂ€sern ist allerdings nicht durchfĂŒhrbar, denn 2000 GlĂ€ser zu kontrollieren ist zu aufwendig und auĂerdem zerstört das Ăffnen eines Glases die Ware.
Allerdings könnte man eine kleine Zahl von GlĂ€sern zufĂ€llig aussuchen, also eine Stichprobe nehmen, und die Zahl der zu beanstandenden GlĂ€ser zĂ€hlen. Ăbersteigt die Zahl eine bestimmte Grenze, den kritischen Wert der PrĂŒfgröĂe, geht man davon aus, dass auch in der Lieferung zu viele zu beanstandende GlĂ€ser sind. Man hofft, dass die Stichprobe die Grundgesamtheit widerspiegelt. Geht die Lieferung deswegen zurĂŒck, besteht die Möglichkeit, dass die Entscheidung richtig war, dass also zu viele GlĂ€ser mit Kernen in der Lieferung sind, aber es kann auch die Stichprobe untypisch ausgefallen sein und man lehnt die Lieferung fĂ€lschlicherweise ab.
Ist die Grundgesamtheit einer Zufallsvariablen unbekannt, nimmt man eine Stichprobe: Man wĂ€hlt n viele Elemente zufĂ€llig aus der Grundgesamtheit aus. Mit Hilfe dieser Stichprobenelemente schĂ€tzt man den unbekannten Parameter der Grundgesamtheit. Diese SchĂ€tzung wird als SchĂ€tzfunktion bezeichnet. Da jede Stichprobe aufgrund der ZufĂ€lligkeit anders ausfĂ€llt, sind auch diese SchĂ€tzfunktionen Zufallsvariablen, deren Verteilung von der Verteilung des Merkmals in der Grundgesamtheit abhĂ€ngt. Mit Hilfe dieser Verteilung kann man Wahrscheinlichkeiten fĂŒr Intervalle angeben, in denen sich mit gröĂter Wahrscheinlichkeit der wahre Parameter befindet, oder man testet, ob eine bestimmte Vermutung, eine Hypothese, ĂŒber den Parameter bestĂ€tigt werden kann.
Man betrachtet ein quantitatives statistisches Merkmal x. Modelltheoretisch wird dieses Merkmal idealisiert: Man geht davon aus, dass es sich in Wahrheit um eine Zufallsvariable X handelt, deren tatsĂ€chliche, âwahreâ Verteilung und âwahreâ Verteilungsparameter unbekannt sind. Man nennt dies die Grundgesamtheit des Merkmals.
Diese Informationen erhofft man sich durch eine Stichprobe: Man entnimmt der Grundgesamtheit zufÀllig n viele Elemente. Mit Hilfe dieser Stichprobenelemente schÀtzt man dann die Parameter.
Um einen Parameter γ einer Verteilung zu schÀtzen, nimmt man aus der Grundgesamtheit eine uneingeschrÀnkte Zufallsstichprobe vom Umfang n, es werden also n Realisationen xi (i = 1, ... , n) der Zufallsvariablen X beobachtet. Man fasst die n Realisationen wahrscheinlichkeitstheoretisch als unabhÀngige Folge von n Zufallsvariablen Xi auf. Um den Parameter γ zu schÀtzen, werden die Xi in geeigneter Weise zusammengefasst. Sie bilden eine SchÀtzfunktion g(X1, X2, ..., Xn) oder Stichprobenfunktion. Da die Stichprobe zufÀllig erfolgt, ist die SchÀtzfunktion wiederum eine Zufallsvariable.
Der Erwartungswert wird mit dem arithmetischen Mittel der Stichprobe geschÀtzt,
FĂŒr die Varianz der Grundgesamtheit verwendet man die Stichprobenvarianz als SchĂ€tzfunktion
Das Merkmal ist normalverteilt mit Erwartungswert ÎŒ und Varianz Ï 2:
Es ist als lineare Transformation der Xi der SchÀtzer normalverteilt,
Ist die Verteilung des Merkmal unbekannt, kann bei genĂŒgend groĂem Stichprobenumfang die Verteilung der SchĂ€tzfunktion nĂ€herungsweise mit der Normalverteilung angegeben werden.
Man betrachtet hier das Urnenmodell mit zwei Sorten Kugeln. Es soll der Anteilswert der Kugeln erster Sorte in der Grundgesamtheit geschÀtzt werden. Als SchÀtzfunktion verwendet man den Anteil der Kugeln erster Sorte in der Stichprobe,
Die SchÀtzfunktion soll konsistent sein.
Konsistenz, mit einfachen Worten, besagt, dass sich die SchÀtzfunktion mit wachsendem n immer mehr dem wahren Parameter γ nÀhert.
Die formale Definition lautet:
Eine SchĂ€tzfunktion ist konsistent, wenn fĂŒr jedes Δ>0 gilt:
Man spricht hier von stochastischer Konvergenz.
Die SchÀtzfunktion soll im Mittel gleich dem wahren Parameter γ sein:
Die SchÀtzfunktion soll eine möglichst kleine Varianz haben. Die SchÀtzfunktion g* aus allen erwartungstreuen SchÀtzfunktionen gk , die die kleinste Varianz hat, wird als beste oder wirksamste SchÀtzfunktion bezeichnet.
Die AusfĂŒhrungen sollen zum besseren VerstĂ€ndnis anhand eines (frei erfundenen) Beispiels erlĂ€utert werden.
In einem privat betriebenen medizinischen Labor ist eine neue Methode zur Vermehrung von Gewebezellen entwickelt worden. Dieses Gewebe soll vor allem bei groĂflĂ€chigen Verbrennungen auf die beschĂ€digte Haut transplantiert werden. Um weiter planen zu können, braucht man nĂ€here Informationen ĂŒber die Schnelligkeit des Zellwachstums. Man interessiert sich fĂŒr die Frage: âWie schwer ist ein Zellklumpen bestimmten Gewichts nach vier Wochen Zucht?â.
Man definiert nun die Zufallsvariable X: Gewicht eines Zellklumpens [g]. Da es sich dabei um ein natĂŒrliches PhĂ€nomen handelt, kann man nach dem zentralen Grenzwertsatz vermuten, dass X normalverteilt ist. Es geht nun aber darum, Informationen ĂŒber die Parameter der Verteilung zu erhalten: Wie schwer ist so ein Zellklumpen im Mittel und wie sehr schwanken die einzelnen Gewichte? Man sucht Informationen ĂŒber den Erwartungswert und die Varianz der Zufallsvariablen.
TatsĂ€chlich ist das Gewicht eines Zellklumpens normalverteilt mit dem Erwartungwert ÎŒ = 10 [g] und der Varianz Ï2 = 4 [g2]. Diese "wahren" Parameter regieren also die Stichprobe, sie sind den Laborbetreibern aber unbekannt.
Man kann nun den Erwartungswert schÀtzen, z.B. mit dem arithmetischen Mittel als SchÀtzfunktion g1,
Es wĂ€re aber als SchĂ€tzer g2 fĂŒr ÎŒ auch der Median z denkbar. Es ist der drittgröĂte Wert:
Man sieht, dass beispielsweise der arithmetische Mittelwert von 7 bis 11,2 schwankt. Auch die Mediane variieren stark.
Wir könnten noch weitere SchĂ€tzfunktionen fĂŒr ÎŒ vorschlagen, etwa
Aus den drei akzeptablen SchÀtzfunktionen wird nun die mit der kleinsten Varianz ausgewÀhlt, denn da ist der SchÀtzwert am verlÀsslichsten. Man kann zeigen, dass das arithmetische Mittel die kleinste Varianz hat. ist also ein bester SchÀtzer.
Die nÀchste Tabelle zeigt die Durchschnitte der vier SchÀtzfunktionen und auch ihre Varianz.
Das Labor schÀtzt also den Erwartungswert mit 9,7 und die Varianz mit
Siehe auch
Siehe
Diese Seite ist ein Artikel über SchĂ€tzen und Testen. Seite Versuche, zum von von Beschreibung über bereitzustellen SchĂ€tzen und Testen. Sie konnten Tatsachen über auch finden SchĂ€tzen und Testen. Erklärung von SchĂ€tzen und Testen.Konzept
Grundgesamtheit bekannt
Grundgesamtheit unbekannt
SchÀtzfunktion
Definition der SchÀtzfunktion
AusgewÀhlte SchÀtzfunktionen
Metrisches Merkmal
Ist die Verteilung symmetrisch, kann auch der Median der Stichprobe als SchĂ€tzer fĂŒr den Erwartungswert verwendet werden:
wobei die Position des Medians in der Mitte einer der GröĂe nach geordneten Liste bezeichnet.
Die Verteilung der SchÀtzfunktionen hÀngt von der Verteilung des Merkmals in der Grundgesamtheit ab.
Der VarianzschĂ€tzer S2 enthĂ€lt eine Quadratsumme von bezĂŒglich zentrierten normalverteilten Zufallsvariablen. Deshalb ist der Ausdruck
zentral Ï2-verteilt mit n-1 Freiheitsgraden.Dichotome Grundgesamtheit
mit X: Zahl der Kugeln erster Sorte in der Stichprobe. Die Verteilung von P ist die gleiche wie die der entsprechenden Zufallsvariablen X, also eine Binomialverteilung im Modell mit ZurĂŒcklegen und eine hypergeometrische Verteilung im Modell ohne ZurĂŒcklegen. WĂŒnschenswerte Eigenschaften von SchĂ€tzfunktionen
Konsistenz
mit gn. = g(X1, X2, ..., Xn).Erwartungstreue
Weicht Eg systematisch von Îł ab, ist der SchĂ€tzer verzerrt (âbiasedâ). Die Verzerrung b ist Minimale Varianz
Weitere Stichworte
Beispiel
Ergebnis des iten Röhrchens
x1
x2
x3
x4
x5
Gewicht der Zellen x
7,4
9,4
10,2
9,6
11,7
Da jede Stichprobe vom Umfang 5 anders ausfallen kann, ist das Mittel selbst eine Zufallsvariable.
Zur Veranschaulichung wurde 1000 mal eine solche Stichprobe per Zufallszahlen erzeugt. Die ersten 18 Stichproben werden in der unten folgenden Tabelle gezeigt. Die ersten fĂŒnf Spalten zeigen die einzelnen Ergebnisse, dann folgen einige SchĂ€tzfunktionen.
den Durchschnitt zwischen der kleinsten und gröĂten Beobachtung, oder
Welche SchÀtzfunktion soll man nun verwenden? Ein Kriterium ist die Erwartungstreue. Erwartungstreu sind vermutlich das arithmetische Mittel und der Median, aber auch die SchÀtzfunktion g3. g4 ist offensichtlich Unsinn, wie auch ein Blick auf die Tabelle zeigt.
SchĂ€tzfunktion fĂŒr ÎŒ
Arithmetisches Mittel
Median
((min(x) + max(x))/2
Wurzel(x1)
Mittelwert der 1000 SchÀtzer
10,00
9,97
10,02
3,15
Varianz der 1000 SchÀtzer
0,79
1,22
1,01
0,10
Konfidenzintervall
Hypothesentest
