Einfacher t-Test

Der einfache t-Test prüft, ob der empirische Stichprobenmittelwert x̄ aus einer Grundgesamtheit mit dem Erwartungswert 𝜇 stammt. Man überprüft hiermit also, ob sich der in der Stichprobe beobachtete Mittelwert signifikant vom Mittelwert der Grundgesamtheit, auf dem die Stichprobe basiert, unterscheidet. Der einfache t-Test wird auch als one-sample t-Test oder Einstichproben-t-Test bezeichnet.

Voraussetzungen für den einfachen t-Test

  • Die Daten der Stichprobe entstammen einer normalverteilten Grundgesamtheit. Dafür ist nach dem zentralen Grenzwertsatz ein Stichprobenumfang größer 30 hinreichend.
  • Die Abhängige Variable ist (quasi-)metrisch skaliert.
  • Der Erwartungswert 𝜇 der Grundgesamtheit ist gegeben.

Signifikanztest des einfachen t-Tests

Um zu prüfen, ob ein Mittelwert mit hinreichender Sicherheit aus der Grundgesamtheit stammt, wird der Signifikanztest des einfachen t-Tests gerechnet.

Zweiseitiges Problem:

H_{0}:\bar{x}=\mu
H_{1}:\bar{x}\neq\mu

Signifikanztest:

t=\sqrt{N}\cdot (\frac{\bar{x}-\mu}{s}) \qquad mit \qquad df=N-1

Testentscheidung nach festgelegtem Signifikanzniveau:

  • Der kritische Wert tkrit kann unter Berücksichtigung des Signifikanzniveaus 𝛼 und der Freiheitsgrade df aus der t-Verteilungstabelle abgelesen werden.
  • Wird zweiseitig getestet, entspricht der kritischer Wert dem (1-α/2)-Quantil der t-Verteilung. Wird einseitig getestet, entspricht der kritischer Wert dem (1-α)-Quantil der t-Verteilung.
  • H0 wird abgelehnt, wenn | t | > tkrit.

Verwendete Kürzel

N: Stichprobengröße
x̄: empirischer Stichprobenmittelwert
𝜇: Parameter der Grundgesamtheit (Erwartungswert)
s: Standardabweichung in der Stichprobe

Einfacher t-Test in R

Die Funktion t_test() aus dem tidycomm-Package berechnet unteranderem den einfachen t-Test für die angegebene Variable und ihren Erwartungswert. Dafür muss das optionale Argument mu angegeben werden, welches den wahren Wert des Mittelwerts in der Grundgesamtheit μ angibt. Die t_test()-Funktion gibt in einer Tabelle den Stichprobenmittelwert, die Standardabweichung, das untere und obere 95%-Konfidenzintervall, den Erwartungswert, den kritischen t-Wert tkrit, die jeweiligen Freiheitsgrade und die p-Werte an.

Ist beispielsweise bekannt, dass Journalist:innen im Mittel 24 Jahre (hier ein fiktiver Wert zu Beispielzwecken) Berufserfahrung haben, kann so ermittelt werden, ob sich die Stichprobe aus dem WoJ-Datensatz signifikant von der Grundgesamtheit unterscheidet.

Zunächst ist mithilfe describe()-Funktion aus dem tidycomm-Package zu ermitteln, ob alle Voraussetzungen erfüllt sind.

Befehl:

WoJ %>% describe(work_experience)

Ausgabe:

> WoJ %>% describe(work_experience)
# A tibble: 1 × 15
  Variable            N Missing     M    SD   Min   Q25   Mdn   Q75   Max Range CI_95_LL CI_95_UL Skewness Kurtosis
* <chr>           <int>   <int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
1 work_experience  1187      13  17.8  10.9     1     8    17    25    53    52     17.2     18.5    0.427     2.41

Nachdem die Stichprobe größer 30 ist, darf nach dem zentralen Grenzwertsatz eine normalverteilte Grundgesamtheit angenommen werden. Die abhängige Variable Arbeitserfahrung (work_experience) ist in Jahren, also metrisch, erhoben. Der Erwartungswert 𝜇 der Grundgesamtheit ist gegeben. Somit darf der einfachen t-Test gerechnet werden.

Befehl:

WoJ %>% t_test(work_experience , mu = 24)

Ausgabe:

> WoJ %>% t_test(work_experience , mu = 24)
# A tibble: 1 × 9
  Variable            M    SD CI_95_LL CI_95_UL    Mu     t    df        p
* <chr>           <dbl> <dbl>    <dbl>    <dbl> <dbl> <dbl> <dbl>    <dbl>
1 work_experience  17.8  10.9     17.2     18.5    24 -19.4  1186 7.38e-73

Einfachen t-Test berichten

Notwendige Informationen

  • empirische Stichprobenmittelwert x̄
  • Erwartungswert 𝜇
  • Standardabweichung in der Stichprobe SD
  • Kritischer t-Wert tkrit
  • Signifikanz und jeweiliges Signifikanzniveau des Zusammenhangs
  • Informationen zur Stichprobengröße (N oder df)

Beispielbericht

„Die Berufserfahrung der vorliegenden Stichprobe beträgt 17,8 Jahre (SD=10,9) und unterscheidet sich signifikant von der durchschnittlichen Berufserfahrung von 24 Jahren innerhalb der Grundgesamtheit an Journalist:innen (t = -19,4; df = 1186; p < ,001).“