Buchvorstellung
Buchcover

Wie ist es möglich, daß die Mathematik, letztlich doch ein Produkt menschlichen Denkens unabhängig von der Erfahrung, den wirklichen Gegebenheiten so wunderbar entspricht?
Albert Einstein

Zur Abstimmung von Einzel- und Globaltest

In der geodätischen Literatur sind vorwiegend zwei Konzepte zur Abstimmung der Irrtumswahrscheinlichkeit zu finden, die häufig im Kontext zur Abstimmung des Global- und Einzeltests vorgestellt werden. Ziel einer solchen Abstimmung ist, dass die Verwerfung des Einzeltests auch zur Verwerfung des globalen Tests führen soll. In diesem Beitrag werden beide Verfahren kurz aufgeführt und am Ende ein Online-Rechner zur Abstimmung bereit gestellt.


Bonferroni-Methode

Betrachtet man die im Rahmen der Ausgleichung durchgeführten Ausreißertests als unabhängige Tests derselben Stichprobe, so erhöht sich die globale Wahrscheinlichkeit für einen Fehler 1. Art. Je mehr Hypothesen beim multiplen Test demnach geprüft werden, desto höher ist die Wahrscheinlichkeit, dass eine davon fälschlicherweise abgelehnt wird. Ein Verfahren zur Begrenzung der Alphafehler-Kumulierung stellt bspw. die Bonferroni-Methode dar. Nach dieser ergibt sich die Irrtumswahrscheinlichkeit der m durchzuführenden (unabhängigen) Einzeltests α' durch Vorgabe eines αG für den Globaltest aus (z.B. Lehmann 2012)


Bonferroni-Methode
Bonferroni-Methode

bzw. in ausreichender Näherung für kleine α


Bonferroni-Methode (Approximation)
Näherung

Für die Bestimmung eines 2D-Neupunktes und einer Orientierungsunbekannten (u=3) liegen in einer Ausgleichung n=8 Beobachtungen vor. Der Globaltest soll mit αG=10% durchgeführt werden. Der auf αG abgestimmte Einzeltest (m=n=8) ergibt sich somit zu α'≈1,3%. Wie zu erkennen ist, nimmt die Irrtumswahrscheinlichkeit α' mit wachsender Anzahl der Beobachtungen schnell ab. Bedingt durch den technischen Fortschritt beinhalten heutige Netze häufig eine sehr große Anzahl an Beobachtungen. Bei n=1000 Beobachtungen liegt α' bereits bei 0,01% und somit deutlich unter dem üblichen Wert. Lehmann (2012) zeigt mittels Monte-Carlo-Simulationen, dass die durchgeführten Einzeltests strenggenommen nicht unabhängig voneinander sind. Die kritischen Werte der mittels Bonferroni-Methode abgestimmten Einzeltests sind stets zu groß. Die Analyse eines Höhennetzes ergab für αG=10% und n=37 ein abgestimmtes α'≈0,3%. Der aus der Simulation abgeleitete Wert beträgt α*≈0,4%, was einen Unterschied im kritischen Wert der normierten Verbesserung von δkNV=3,0-2,9≈0,1 zur Folge hat. Um diese Differenz besser einordnen zu können, ist der Einfluss des mehr oder weniger willkürlich gewählten αG auf die sich ergebenen kritischen Werte zunächst zu hinterfragen. Mit αG=0,1% (n=37) ergebt sich für α'≈0,03%, was einem kritischen Wert für die normierte Verbesserung von kNV=3,64 entspricht. Mit der aus der Simulation abgeleiteten Irrtumswahrscheinlichkeit ergibt sich ein etwas kleinerer kritischer Wert von kNV=3,62 für das betrachtete Höhennetz (vgl.  Lehmann 2012).

Leider lassen sich keine allg. Aussagen zur Größe der Differenzen angeben, sodass diese kontextbezogen zu ermitteln sind. Insbesondere bei einer großen Differenz (r≪n) zwischen dem Gesamtfreiheitsgrad r und der Anzahl der Beobachtungen n sind signifikante Unterschiede zu erwarten (Lehmann 2013). Dennoch gilt, dass die Vernachlässigung der Abhängigkeiten zwischen den Einzeltests in Abhängigkeit des Netzes nur einen vergleichsweise geringen Einfluss auf die abgeleiteten kritischen Werte ausübt. Maßgebend ist demnach das gewählte αG für den Globaltest. Berücksichtigt man, dass unkontrollierte Beobachtungen, die einen Redundanzanteil von Null aufweisen, nicht mit statistischen Tests auf Störungen geprüft werden können, so erscheint es sinnvoll, anstelle von n nur die Anzahl der überschüssigen Beobachtungen r=n-u bei der Abstimmung durch m zu berücksichtigen (vgl. auch Niemeier 2008).


B-Methode (bzw. β-Methode)

Ein anderes Konzept geht auf die Arbeiten von Baarda (1968) zurück. Bei dieser Methode erfolgt die Testabstimmung zwischen Einzel- und Globaltest auf der Basis einer einheitlichen Testgüte, weshalb diese Methode auch als B-Methode (bzw. β-Methode) bezeichnet wird. Die Abstimmung erfolgt über die Beziehung (z.B. Jäger et al. 2005)


B-Methode (Baarda)
B-Methode

worin λ den Nichtzentralitätsparameter, β die Testgüte und α die Irrtumswahrscheinlichkeiten des Einzel- bzw. Globaltests beschreiben. Durch die Vorgabe der Testgüte β und αG kann auf die Irrtumswahrscheinlichkeit α' für den Einzeltest zurückgeschlossen werden. Mit den o.g. Werten des Eingangsbeispiels (αG=10%, u=3, n=8) und einer Testgüte β=80% ergibt sich α'≈1,7% für den Einzeltest. In der Praxis geht man häufig jedoch den umgekehrten Weg und legt α' für den Einzeltest fest und leitet daraus αG ab. Dies hat neben rechentechnischen Aspekten den Vorteil, dass unabhängig vom Ausgleichungsproblem und der Anzahl der Beobachtungen für jeden Einzeltest stets dieselbe Irrtumswahrscheinlichkeit angesetzt wird. Mit der Vorgabe von bspw. α'=1% (β=80%, r=n-u=5) ergibt sich für den Globaltest ein αG≈7%. Im Rahmen einer Netzausgleichung, bei der neben klassischen terrestrischen Beobachtungen auch Lageanschlußpunkte oder GNSS-Basislinien auf Fehler zu prüfen sind, lässt sich das Konzept der B-Methode auf die Prüfung mehrdimensionaler Modellfehler übertragen (vgl. Hahn et al. 1989).


B-Methode für multiple Tests
Allgemeine B-Methode

Für die Irrtumswahrscheinlichkeit zum Testen eines Lageanschlußpunktes ergibt sich α'2≈2,3% (β=80%, m=2), wenn wiederum α'1=1% für den Einzeltest angenommen wird.

Führt der Globaltest zur Verwerfung, so ist zur Lokalisierung der Modellstörung in jedem Fall ein Einzeltest durchzuführen. In der geodätischen Netzausgleichung gehört das Testen jeder einzelnen Beobachtung durch einen Einzeltest zum Standard, was die Aussagekraft des Globaltests zwar nicht mindert aber in der Bewertungshierarchie nach hinten rücken lässt. Insbesondere auch weil bei Netzen mit großem Freiheitsgrad das abgestimmte αG steigt und unter Umständen zu einer Überempfindlichkeit führt – der Globaltest wird verworfen obwohl sich durch den Einzeltest keine Modellstörung nachweisen lässt. Hahn et al. (1991) schlagen daher vor


Nichtzentralitätsparameter
Dämpfung

zu wählen, wenn neben dem Globaltest auch der Einzeltest durchgeführt wird. Wie Marx (2013) zeigt, führt diese Modifikation grundsätzlich zu einem flacheren Verlauf von αG im Vergleich zur B-Methode (siehe nachfolgende Abbildung). Aus der o.g. Bonferroni-Gleichung ist jedoch ersichtlich, dass αGα' zu fordern ist, was durch die einfache Skalierung des Nichtzentralitätsparameters nicht immer erreicht wird. Marx (2013) schlägt daher eine zweistufige Adaption der B-Methode vor. Für Netze mit kleinem Freiheitsgrad erfolgt die Abstimmung durch die B-Methode nach Baarda. Für größere Netze hingegen wird auf die Forderung nach gleicher Testgüte zwischen Einzel- und Globaltest zunehmend verzichtet und β in Abhängigkeit von m reduziert.


Vergleich Bonferroni- und B-Methode für verschiedene Freiheitsgrade
Vergleich Bonferroni- und B-Methode

Die Abbildung zeigt den Verlauf der abgestimmten Irrtumswahrscheinlichkeit für den Globaltest in Abhängigkeit des Freiheitsgrades (α'=1%, β=80%) für die Bonferroni und die B-Methode, wobei für β(m) das von Marx (2013) favorisierte Modell mit β=5% verwendet wurde.


Dämpfung der Testgüte als Funktion vom Freiheitsgrad
β-Abklingfunktion

Während für kleine Freiheitsgrade die Ergebnisse der β(m)-gedämpften Funktion mit der B-Methode übereinstimmen, wird ein weiterer Anstieg über αG>10% durch a≈29,4 unterbunden. Durch die zusätzliche Forderung βG für große Freiheitsgrade kann einem Unterschreiten von αG<5% entgegengewirkt werden. Im Vergleich zur Modifikation von Hahn et al. (1991) ist die Anpassung von αG durch β(m) mit der von Marx (2013) vorgeschlagenen Abklingfunktion deutlich schwieriger programmtechnisch umzusetzen. Insbesondere dann, wenn man dem Nutzer keine feste Konfiguration vorgeben möchte.

Die Ergebnisse der Abstimmung von αG über die Modifikation von β lassen sich auch direkt aus einer Funktion αG(m) herleiten. Bereits


Dämpfung der Irrtumswahrscheinlichkeit als Funktion vom Freiheitsgrad
α-Abklingfunktion

liefert für a≈13 mit derselben Abklingfunktion einen annähernd identischen Verlauf wie die β(m)-Kurve, was u.a. die Verwendung von Tafelwerken weiter ermöglichen würde.


Online Rechner

Im freien Ausgleichungsprogramm JAG3D ist zur Abstimmung der Teststatistiken die B-Methode im klassischen Sinne ohne Dämpfungsfunktion implementiert. Bei der geodätischen Netzausgleichung erfolgt in diesem Programm die Abstimmung auf den a-priori Varianz-bezogenen Einzeltest. Für die Abstimmung wird auf eine Portierung von entsprechenden R-Bibliotheken zurückgegriffen. Für den hier bereitgestellten Online-Rechner wurden Teile dieser Bibliothek nach JavaScript überführt.

 

λ(α'=%,β=%,m'=)=λ(αG=7.03%,β=80.0%,m=)=11.7

 

Die Abstimmung für die globale Irrtumswahrscheinlichkeit αG erfolgt durch Vorgabe der Irrtumswahrscheinlichkeit α', der Testgüte β, der Dimension des Referenztests m' und dem Gesamtfreiheitsgrad m. Aufgrund der Einfachheit der Bonferroni-Methode wird auf ein äquivalentes Berechnungsscript verzichtet. Zur Bestimmung des zugehörigen Quantils der F-Verteilung sei auf den Artikel: Zum Einsatz der F-Verteilung bei gerichteten und ungerichteten Hypothesentests verwiesen. Dort sind ein Algorithmus und ein Online-Rechner verfügbar.


Quellen

Verwendete Literatur, die nicht der Bibliothek entnommen ist:

  • Baarda, W. (1968): A testing procedure for use in geodetic networks. Publication on Geodesy, Niederlande.
  • Hahn, M., Heck, B., Jäger, R., Scheuring, R. (1989): Ein Verfahren zur Abstimmung der Signifikanzniveaus für allgemeine Fm,n-verteilte Teststatistiken, Teil I: Theorie. ZfV.
  • Hahn, M., Heck, B., Jäger, R., Scheuring, R. (1991): Ein Verfahren zur Abstimmung der Signifikanzniveaus für allgemeine Fm,n-verteilte Teststatistiken. Teil II: Anwendungen. ZfV.
  • Lehmann, R. (2012): Improved critical values for extreme normalized and studentized residuals in Gauss–Markov models. Journal of Geodesy.
  • Lehmann, R. (2013): The 3sigma-rule for outlier detection from the viewpoint of geodetic adjustment. Journal of Surveying Engineering.
  • Marx, Ch. (2013): Zur Abstimmung der Signifikanzniveaus von Global- und Einzeltest. AVN.

26.06.2013 von Michael Lösler