Wie können Sie feststellen, ob ein Unterschied zwischen den Mitteln zweier Stichproben signifikant ist? - Statistiken - 2020

Anonim

Antworten:

Sie bilden eine neue Statistik, die den Unterschied zwischen den beiden Mitteln darstellt, und ermöglicht es Ihnen, Signifikanzfragen dazu zu stellen.

Erläuterung:

In dieser Frage wollen wir den Unterschied zwischen zwei Mitteln kennenlernen. Dies ist eine Funktion von Zufallsvariablen, d. H.

#mu_ (1-2) = mu_1-mu_2 #

oder, in unserem Fall ist die Funktion des Beispiels:

#m_ (1-2) = m_1-m_2 #

Es gibt viele Annahmen, die in die nächsten Schritte einfließen (siehe diesen Link für Details Stat Trek: Unterschied zwischen den Mitteln), aber lassen Sie uns jetzt annehmen, dass die zwei Verteilungen, die wir abtasten, ungefähr normal sind und dass wir nur relativ wenige Abtastpunkte für jede haben (Andernfalls wären wir uns der Mittelwerte und damit der Differenz sicher).

Aus diesem Grund können wir die Stichprobenvarianz der Mittelwertdifferenz aus den Stichprobenvarianzen der beiden Stichproben berechnen:

#s_ (1-2) ^ 2 = s_1 ^ 2 / n_1 + s_2 ^ 2 / n_2 #

Beachten Sie, dass bei dieser Berechnung die Stichprobenvarianzen dividiert durch die Anzahl der Punkte berücksichtigt werden. Dies ist die Varianz der berechneten Mittelwerte und folgt der erwarteten Form des zentralen Grenzwertsatzes (Varianz des Stichprobenmittelwerts).

Bevor wir mithilfe von t-statistics Fragen zur neuen Verteilung stellen, müssen wir die Freiheitsgrade kennen, aus denen (der Welch-Satterthwaite-Gleichung) angenähert werden kann:

# DF = (s_1 ^ 2 / n_1 + s_2 ^ 2 / n_2) ^ 2 / ((s_1 ^ 2 / n_1) ^ 2 / (n_1-1) + (s_2 ^ 2 / n_2) ^ 2 / (n_2-1 )) #

Diese Gleichung ermöglicht eine unterschiedliche Signifikanz jedes Punktes von den beiden Verteilungen basierend auf ihrer Varianz und eine unterschiedliche Anzahl von Abtastwerten von jeder. Wenn die Verteilungen die gleiche Varianz haben und wir die gleiche Anzahl von Proben nehmen, # n #, von jedem vereinfacht dies zu # D.F. = 2n-2 #

In Anbetracht all dieser Fragen können wir die Verteilung von Students-t verwenden, um Fragen zur Wahrscheinlichkeit der Statistik zu stellen #m_ (1-2) # bestimmte Werte annehmen mit:

#t = m_ (1-2) - d / s_ (1-2) #

Dabei ist d der vorgeschlagene Abstand zwischen den beiden Mitteln.