Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the pods domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/haim/datenanalyse/wp-includes/functions.php on line 6114
z-Test – Datenanalyse mit R

z-Test

Was ist ein z-Test?

Der z-Test ist ein Hypothesentest, der Hypothesen über die Häufigkeit von einem Merkmal in der Grundgesamtheit testet. Er stellt ein Werkzeug für den Inferenzschluss von einer, in einer Stichprobe, ermittelten Häufigkeit auf die Häufigkeit in der Grundgesamtheit dar.

Dafür werden kritische Werte in Abhängigkeit der Stichprobengröße und der Häufigkeit, über die eine Aussage gemacht wird, bestimmt.

Bestimmung der kritischen Werte

Linksseitig getestete Hypothese:

k=N\cdot p_{0}- z_{1-\alpha}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}

Rechtsseitig getestete Hypothese:

k=N\cdot p_{0}+ z_{1-\alpha}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}

Zweiseitig getestete Hypothese:

k_{u}=N\cdot p_{0}- z_{1-\frac{\alpha}{2}}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}
k_{o}=N\cdot p_{0}+ z_{1-\frac{\alpha}{2}}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}

Verwendete Kürzel

  • „k“ ist der kritische Wert, ku ist der untere kritische Wert, ko ist der obere kritische Wert bei einem zweiseitigen Test.
  • N“ ist die Stichprobengröße.
  • p0“ ist die Häufigkeit, über die eine Aussage gemacht wird.
  • „z“ ist der z-Wert.
  • „α“ ist das Signifikanzniveau und steht für die Wahrscheinlichkeit der Menge von Testergebnissen, für die wir bereit sind, H0 zurückzuweisen, obwohl sie zutreffend ist. Meist werden das 5%- und das 1%-Signifikanzniveau verwendet (𝛼 = 0,05 bzw. 𝛼 = 0,01).

Häufige z-Werte sind folglich:

  • 𝛼 = 0,05 und einseitig getestet: 1,64
  • 𝛼 = 0,05 und zweiseitig getestet: 1,96
  • 𝛼 = 0,01 und einseitig getestet: 2,33
  • 𝛼 = 0,01 und zweiseitig getestet: 2,58

Voraussetzungen

Es muss gelten:

N\cdot p_{0}\cdot\left(1-p_{0}\right)>9

Beispiele

Der linksseitige z-Test

Die ARD behauptet, dass mindestens 50 Prozent der Deutschen den „Tatort“ mögen. Medienforscherin Tina Franz bezweifelt das und sagt, es sind weniger.

Tina befragt 100 zufällig ausgewählte Deutsche, von denen 40 sagen, dass sie keinen Tatort mögen. Tina testet bei einem Signifikanzniveau von 5%.

H_{0}:p\geq0,5
H_{1}:p<0,5
k=N\cdot p_{0}- z_{1-\alpha}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}
k=100\cdot 0,5- 1,64\cdot \sqrt{100\cdot 0,5\cdot \left(1-0,5\right)}
k=50-8,2=41,8

Annahmebereich: [42; 100]

Ablehnungsbereich: [0; 41]

Die Nullhypothese muss abgelehnt werden, die Häufigkeit, die Tina ermittelt weicht signifikant vom Wert, den die ARD behauptet ab. Weniger als die Hälfte der Deutschen mögen den „Tatort“ (N=100, p < ,050).

Der rechtsseitig z-Test

Der Löwen-Sportvorstand behauptet, nicht mehr als 70 Prozent der Münchner:innen sind Bayern-Fans. Der FC-Bayern Chef sagt, es sind mehr.

Der FC-Bayern Chef gibt deshalb eine Studie in Auftrag, es werden 50 zufällig ausgewählte Münchner:innen befragt, von denen 42 sagen sie seien Bayern-Fans. In der Studie wird mit einem Signifikanzniveau von 5% getestet.

H_{0}:p\leq0,7
H_{1}:p>0,7
k=N\cdot p_{0}+ z_{1-\alpha}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}
k=50\cdot 0,7+ 1,64\cdot \sqrt{50\cdot 0,7\cdot \left(1-0,7\right)}
k=35+5,31=40,3

Annahmebereich: [0; 40]

Ablehnungsbereich: [41; 50]

Die Nullhypothese muss abgelehnt werden, die Häufigkeit, die in der Studie ermittelt wird, weicht signifikant vom Wert, den der Löwen-Sportvorstand behauptet ab. Mehr als 70% der Münchner:innen sind Bayern-Fans (N=50, p < ,050).

Der zweiseitige z-Test

Anna-Maria spielt „Mensch ärgere Dich nicht“ und vermutet, dass sie es mit einem gezinkten Würfel zu tun hat. Also würfelt sie 100-mal, dabei zeigt sich, dass die „1“ nur 12-mal vorkommt. Sie möchte bei einem Signifikanzniveau von 5% testen.

H_{0}:p=\frac{1}{6}
H_{1}:p\neq\frac{1}{6}
k_{u}=N\cdot p_{0}- z_{1-\frac{\alpha}{2}}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}
k_{u}=100\cdot \frac{1}{6}- 1,96\cdot \sqrt{100\cdot \frac{1}{6}\cdot \left(1-\frac{1}{6}\right)}=9,4
k_{o}=N\cdot p_{0}+ z_{1-\frac{\alpha}{2}}\cdot \sqrt{N\cdot p_{0}\cdot \left(1-p_{0}\right)}
k_{o}=100\cdot \frac{1}{6}+ 1,96\cdot \sqrt{100\cdot \frac{1}{6}\cdot \left(1-\frac{1}{6}\right)}=24,0

Annahmebereich: [10; 24]

Ablehnungsbereich: [0; 9] und [25; 100]

Die Nullhypothese darf angenommen werden, die Häufigkeit, die in der Studie ermittelt wird, weicht nicht signifikant vom erwarteten Wert für einen Würfel ab (N=100, p > ,050). Der Würfel ist mit hinreichender Sicherheit nicht gezinkt.