Buchvorstellung
Buchcover

Er ist ein Mathematiker und also hartnäckig.
Johann Wolfgang von Goethe

Zum Einsatz der F-Verteilung bei gerichteten und ungerichteten Hypothesentests

In nahezu allen Ingenieurbereichen werden statistische Tests zur Überprüfung von Hypothesen eingesetzt. Speziell in der Geodäsie werden diese Testverfahren zum Aufdecken von Modellstörungen, die bspw. durch Beobachtungsfehler hervorgerufen werden, standardmäßig eingesetzt. Neben dem Prüfen von Modellparametern z.B. in der Regressionsanalyse können mit statistischen Tests auch Beobachtungen auf Modellverträglichkeit überprüft werden. In der Netzausgleichung hat sich hierbei das von Baarda (1968) vorgeschlagene Verfahren des Data-Snoopings als Standardverfahren zum Aufdecken von Beobachtungsfehler etabliert. Der Parametervektor x wird hierzu um den Anteil der Störparameter erweitert. Entsprechend der Anzahl der Störparameter sind in der Normalgleichungsmatrix Spalten und Zeilen hinzuzufügen. Das erweiterte Modell lautet demnach:


Erweiterte Normalgleichung
Erweiterte Normalgleichung

worin A und B Jacobimatrizen sind, die die partiellen Ableitungen der Beobachtungsgleichungen nach den Modellparametern x bzw. beinhalten, und P die inverse Kofaktormatrix der Beobachtungen l ist. Bei der Bestimmung der Zusatz- bzw. Störparameter kann auf eine erneute Inversion der Normalgleichung verzichtet werden. Dies ist ein entscheidender Vorteil, der maßgeblich zur weiten Verbreitung des Data-Snoopings beigetragen hat. Der geringe Berechnungsaufwand erlaubt es, eine Vielzahl von unterschiedlichen Modellstörungen zu modellieren und statistisch zu prüfen bzw. zu bewerten (vgl. Jäger et al. 2005).

Die Entscheidung, ob die geschätzten Parameter signifikant sind, erfolgt über einen statistischen Test mit einer vorgegeben Irrtumswahrscheinlichkeit α. Hierzu ist neben auch die zugehörige Unsicherheit in Form einer Kovarianzmatrix Q∇∇ notwendig.


Geschätzte Modellstörung und Kovarianzmatrix
Modellstörung und Kovarianzmatrix

mit der Kofaktormatrix Qvv der Beobachtungsverbesserungen v. Mittels Teststatistik ist nun zu prüfen, ob die Werte in signifikant vom Erwartungswert E{} abweichen. Im Rahmen des Data-Snoopings ist der Erwartungswert für einen Beobachtungsfehler E{}=0 – es liegen keine Fehler vor. Die zugehörige Teststatistik lautet allg.:


Allgemeine Teststatistik mittels F-Verteilung
Allgemeine Teststatistik

worin mit σ2 der Varianzfaktor a-priori bzw. a-posteriori gemeint ist und m die Anzahl der Parameter in repräsentieren. Die Testgröße folgt beim Zutreffen der Nullhypothese H0 der zentralen F-Verteilung (Fisher-Verteilung) mit den Freiheitsgraden m und n. Unter bestimmten Umständen kann diese Teststatistik stark vereinfacht werden. In der geodätischen Netzauswertung werden beim (einfachen) Data-Snooping mit m=1 immer nur eine Beobachtung auf einen groben Fehler hin untersucht. Ferner werden im stochastischen Modell häufig Abhängigkeiten vernachlässigt, wodurch P eine diagonale Gewichtsmatrix beschreibt. Statt der F-verteilten Teststatistik wird dann – in Abhängigkeit des Varianzfaktors – auf eine normalverteilte bzw. Student-t-verteilte Teststatistik zur Prüfung auf Beobachtungsfehler zurückgegriffen (vgl. Jäger et al. 2005, Niemeier 2008, Benning 2010). Die Teststatistik für einen Fehler in einer unkorrelierten Beobachtung unter Berücksichtigung des a-priori Varianzfaktors lautet:


z-Test (Normierte Verbesserung)
z-Test (Normierte Verbesserung)

und die a-posteriori bezogene Teststatistik ergibt sich aus:


Student-t-Test
t-Test

worin sich der vom Einfluss der möglichen Modellstörung korrigierte Varianzfaktor aus


Korrigierter a-posteriori Varianzfaktor
a-post Varianzfaktor

ergibt (vgl. Heck 1981).

Sowohl die normierte Verbesserung (z-Test) als auch der t-Test können als Sonderfälle des o.g. allgemeinen F-Tests aufgefasst werden. Die Zusammenhänge zwischen den Verteilungen sind (vgl. Jäger et al. 2005)


Zusammenhang zwischen z-Test und F-Test
z- vs. F-Test

und


Zusammenhang zwischen t-Test und F-Test
t- vs. F-Test

Für den Sonderfall m=1 ist die Testgröße des F-Tests demnach lediglich quadriert gegenüber dem z-Test bzw. dem t-Test. Der Dichtefunktionsverlauf ist stets positiv bei der F-Verteilung und weist keine Symmetrie auf, wie dies bei der Standardnormalverteilung der Fall ist. Hierdurch ergeben sich teilweise Verständnisprobleme, wenn einseitige (gerichtete) oder zweiseitige (ungerichtete) Hypothesen zu bewerten sind. Während der F-Test stets zweiseitige Fragestellungen bei Vorgabe eines α testet, ist bei Verwendung der Standardnormalverteilung und zweiseitiger Fragestellung das α-Niveau zu halbieren. Oder andersherum, um mit dem F-Test einen einseitigen Test durchzuführen, ist das α-Niveau zu verdoppeln (vgl. Teunissen 2006, Kirst 2013). Dieser Zusammenhang wird teilweise auch in den geodätischen Lehrbüchern inkorrekt wiedergegeben.


Nummerisches Beispiel einer Setzungsmessung

Ein nummerisches Beispiel soll den Sachverhalt kurz skizzieren. Im Rahmen einer Deformationsanalyse in einem Höhennetz soll geprüft werden, ob die festgestellte Setzung in einem Punkt von ∇ = -2.5 mm (σ=1.3 mm) signifikant von E{∇}=0 abweicht. Durch die Einschränkung der Deformationsrichtung auf Setzung handelt es sich um eine gerichtete Hypothese. Die mittels einseitigen z-Tests zu prüfende Testgröße ist:


Testgröße (z-Test)
Testgröße (z-Test)

Wird der Test hingegen als F-Test formuliert, so ergibt sich die quadratische Testgröße zu:


Testgröße (F-Test)
Testgröße (F-Test)

Als Sicherheitswahrscheinlichkeit p=1-α werden aus »Gewohnheit, Gesetz oder Aberglaube häufig 95%, 99% oder auch 99,5%« verwendet (Morgenstern 1964). Bei Vorgabe von α=5% und einseitiger Fragestellung ist das Quantil der Standardnormalverteilung kN,1-α=1,64. Überschreitet die (absolute) Testgröße T() diesen kritischen Wert, ist die Nullhypothese zu verwerfen und die festgestellte Setzung signifikant. Das Quantil des äquivalenten F-Tests beträgt kF,1-2α=2,70 und entspricht - analog zur Testgröße - dem quadrierten Wert des z-Tests, wodurch es zur selben Testentscheidung kommt: Die detektierte Setzung des Punktes ist signifikant von Null verschieden. Bedingt durch die einseitige Fragestellung ist bei der Ableitung des F-Quantils das α-Niveau jedoch zu verdoppeln.

Wäre auch eine Hebung des Punktes nicht ausgeschlossen, ist die Prüfung ungerichtet zu formulieren. Die Quantile der Standardnormal- und F-Verteilung für diesen zweiseitigen (ungerichteten) Test lauten kN,1-α/2=1,96 bzw. kF,1-α=3,84. Die kritischen Werte sind stets größer als die zugehörige Testgröße, womit die Nullhypothese nicht abzulehnen ist. Die festgestellte Höhenänderung von ∇ = -2.5 mm wäre demnach als zufällig zu bewerten.

Der Vorteil des F-Tests ist, dass er auch für statistische Tests herangezogen werden kann, bei denen mehr als nur m=1 Prüfgrößen enthält. Im Rahmen der Deformationsanalyse wäre dies bspw. der Fall, wenn ein Verschiebungsvektor im Lagenetz (m=2) oder Raumnetz (m=3) auf Veränderung hin untersucht werden soll oder eine gleichgerichtete Veränderung einer Punktgruppe (Starrkörperbewegung) untersucht wird.


Algorithmus zur Bestimmung der Quantilwerte der F-Verteilung

Zur Durchführung eines statistischen Tests wird das Quantil der Verteilung benötigt. Diese Quantile sind zwar in den meisten Büchern für gebräuchliche Irrtumswahrscheinlichkeiten vertafelt aber gerade bei programmgestützten Analysen ist eine entsprechende Berechnungsroutine zwingend erforderlich. Insbesondere wenn spezielle Sicherheitswahrscheinlichkeiten gewählt werden, wie dies unter anderem beim Abstimmen von Teststatistiken der Fall ist. Für einige Verteilungen, wie bspw. der Standardnormalverteilung, welche beim z-Test benötigt wird, finden sich Approximationen in der geodätischen Literatur (z.B. Benning 2010).

Zur Bestimmung der Irrtumswahrscheinlichkeit α=1-p der universellen F-Verteilung gibt Emerson (1988) einen schlanken Algorithmus in BASIC und C an, der sich leicht in andere Sprachen portieren lässt. Eine inverse Funktion zum Ableiten des F-Quantils bei gegebener Irrtumswahrscheinlichkeit α lässt sich leicht mittels Bisektionsverfahren realisieren. Eine entsprechende Umsetzung in JavaScript ist nachfolgend zu finden und kann bei aktivem JavaScript zur Bestimmung von kritischen Werten anstelle einer Quantiltabelle verwendet werden.

function F() {
	var HL2PI = 0.5*Math.log(2.0*Math.PI);
	var ARGMIN = 18;
	var SMALL = 1.0E-11;
	var EXPMIN = -700;
	
	var logamma = function(a){
		var n = ARGMIN - Math.floor(a);
		if (n > 0)
			a += n;
		var g = 1.0/a/a;
		g = (1.0 - g*(1.0/30.0 - g*(1.0/105.0 - g*(1.0/140.0 - g/99.0))))/12.0/a;
		g += ((a-0.5)*Math.log(a) - a + HL2PI);
		for (var i=0; i < n; i++) {
			a -= 1.0;
			g -= Math.log(a);
		}
		return g;
	};

	var series = function(F,dfn,dfd) {
		dfn /= 2.0;
		dfd /= 2.0;
		var x = dfd/(dfd  + dfn*F);
		var c = logamma(dfn + dfd) - logamma(dfn) - logamma(dfd + 1.0);
		c += dfd*Math.log(x) + dfn*Math.log(1.0-x);
		c = Math.exp(c);
		if (c == 0)
			return -1.0;
		dfn += dfd;
		dfd += 1.0;
		var er = SMALL/c;
		var t = dfn*x/dfd;
		var n=0.0, t1=0.0, s=1.0+t;
		while( t > er || t > t1 ) {
			n++;
			t1 = t;
			t *= ((dfn+n)*x/(dfd+n));
			s += t;
		}

		return s*c;
	};

	this.ftail = function(F,dfn,dfd) {
		if ( F*dfn >= dfd || F > 1.0 + 20.0/dfn + 10.0/Math.sqrt(dfn))
			p = series(F,dfn,dfd);
		else
			p = 1.0 - series(1.0/F,dfd,dfn);
		if (p > 1 || p < 0) {
			if (F > 1)
				p = 0.0;
			else if (F == 1.0)
				p = 0.5;
			else
				p = 1.0;
		}
		return p;
	};
};


F(α=%, m=, n=) = 10.828

 

Für Teststatistiken, die sich auf den a-priori Varianzfaktor beziehen, ist theoretisch der Freiheitsgrad n=∞ zu wählen. Im Onlinerechner ist Unendlich durch eine sehr große Zahl z.B. n=100000≈∞ zu approximieren.


Quellen

Verwendete Literatur, die nicht der Bibliothek entnommen ist:

  • Baarda, W. (1968): A testing procedure for use in geodetic networks. Publication on Geodesy, Niederlande.
  • Emerson P.L. (1988)Fishtail Practical F Integration on Small Computers in Basic and CBehavior Research Methods Instruments and Computers, 20 (1), S. 65-69.
  • Heck, B (1981) Der Einfluß einzelner Beobachtungen auf das Ergebnis einer Ausgleichung und die Suche nach Ausreißern in den Beobachtungen. Allgemeine Vermessungsnachrichten, 88(1), S. 17-34.
  • Kirst, E. (2013): Sind Chi-Quadrat-Test und F-Test ein- oder zweiseitige Tests oder beides?
  • Morgenstern, D. (1964): Einführung in die Wahrscheinlichkeitsrechnung und Mathematische Statistik. Springer-Verlag, Berlin Göttingen Heidelberg.
  • Teunissen, P.J.G. (2006): Network quality control. VSSD, Delft.

20.05.2015 von Michael Lösler