Der einfache t-Test prüft, ob der empirische Stichprobenmittelwert x̄ aus einer Grundgesamtheit mit dem Erwartungswert 𝜇 stammt. Man überprüft hiermit also, ob sich der in der Stichprobe beobachtete Mittelwert signifikant vom Mittelwert der Grundgesamtheit, auf dem die Stichprobe basiert, unterscheidet. Der einfache t-Test wird auch als one-sample t-Test oder Einstichproben-t-Test bezeichnet.
Voraussetzungen für den einfachen t-Test
- Die Daten der Stichprobe entstammen einer normalverteilten Grundgesamtheit. Dafür ist nach dem zentralen Grenzwertsatz ein Stichprobenumfang größer 30 hinreichend.
- Die Abhängige Variable ist (quasi-)metrisch skaliert.
- Der Erwartungswert 𝜇 der Grundgesamtheit ist gegeben.
Signifikanztest des einfachen t-Tests
Um zu prüfen, ob ein Mittelwert mit hinreichender Sicherheit aus der Grundgesamtheit stammt, wird der Signifikanztest des einfachen t-Tests gerechnet.
Zweiseitiges Problem:
H_{0}:\bar{x}=\mu
H_{1}:\bar{x}\neq\mu
Signifikanztest:
t=\sqrt{N}\cdot (\frac{\bar{x}-\mu}{s}) \qquad mit \qquad df=N-1
Testentscheidung nach festgelegtem Signifikanzniveau:
- Der kritische Wert tkrit kann unter Berücksichtigung des Signifikanzniveaus 𝛼 und der Freiheitsgrade df aus der t-Verteilungstabelle abgelesen werden.
- Wird zweiseitig getestet, entspricht der kritischer Wert dem (1-α/2)-Quantil der t-Verteilung. Wird einseitig getestet, entspricht der kritischer Wert dem (1-α)-Quantil der t-Verteilung.
- H0 wird abgelehnt, wenn | t | > tkrit.
Verwendete Kürzel
N: Stichprobengröße
x̄: empirischer Stichprobenmittelwert
𝜇: Parameter der Grundgesamtheit (Erwartungswert)
s: Standardabweichung in der Stichprobe
Einfacher t-Test in R
Die Funktion t_test()
aus dem tidycomm-Package berechnet unteranderem den einfachen t-Test für die angegebene Variable und ihren Erwartungswert. Dafür muss das optionale Argument mu
angegeben werden, welches den wahren Wert des Mittelwerts in der Grundgesamtheit μ angibt. Die t_test()
-Funktion gibt in einer Tabelle den Stichprobenmittelwert, die Standardabweichung, das untere und obere 95%-Konfidenzintervall, den Erwartungswert, den kritischen t-Wert tkrit, die jeweiligen Freiheitsgrade und die p-Werte an.
Ist beispielsweise bekannt, dass Journalist:innen im Mittel 24 Jahre (hier ein fiktiver Wert zu Beispielzwecken) Berufserfahrung haben, kann so ermittelt werden, ob sich die Stichprobe aus dem WoJ-Datensatz signifikant von der Grundgesamtheit unterscheidet.
Zunächst ist mithilfe describe()
-Funktion aus dem tidycomm-Package zu ermitteln, ob alle Voraussetzungen erfüllt sind.
Befehl:
WoJ %>% describe(work_experience)
Ausgabe:
> WoJ %>% describe(work_experience)
# A tibble: 1 × 15
Variable N Missing M SD Min Q25 Mdn Q75 Max Range CI_95_LL CI_95_UL Skewness Kurtosis
* <chr> <int> <int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 work_experience 1187 13 17.8 10.9 1 8 17 25 53 52 17.2 18.5 0.427 2.41
Nachdem die Stichprobe größer 30 ist, darf nach dem zentralen Grenzwertsatz eine normalverteilte Grundgesamtheit angenommen werden. Die abhängige Variable Arbeitserfahrung (work_experience) ist in Jahren, also metrisch, erhoben. Der Erwartungswert 𝜇 der Grundgesamtheit ist gegeben. Somit darf der einfachen t-Test gerechnet werden.
Befehl:
WoJ %>% t_test(work_experience , mu = 24)
Ausgabe:
> WoJ %>% t_test(work_experience , mu = 24)
# A tibble: 1 × 9
Variable M SD CI_95_LL CI_95_UL Mu t df p
* <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 work_experience 17.8 10.9 17.2 18.5 24 -19.4 1186 7.38e-73
Einfachen t-Test berichten
Notwendige Informationen
- empirische Stichprobenmittelwert x̄
- Erwartungswert 𝜇
- Standardabweichung in der Stichprobe SD
- Kritischer t-Wert tkrit
- Signifikanz und jeweiliges Signifikanzniveau des Zusammenhangs
- Informationen zur Stichprobengröße (N oder df)
Beispielbericht
„Die Berufserfahrung der vorliegenden Stichprobe beträgt 17,8 Jahre (SD=10,9) und unterscheidet sich signifikant von der durchschnittlichen Berufserfahrung von 24 Jahren innerhalb der Grundgesamtheit an Journalist:innen (t = -19,4; df = 1186; p < ,001).“