Hypothesentests: Signal oder Rauschen?
Hypothesentests: Wann ist ein Unterschied echt und wann nur Zufall?
Die Grundidee: Nullhypothese und Alternativhypothese
Nullhypothese (H0):
Sie steht für den Status quo – „alles ist wie immer“. Im Beispiel einer Süßwarenfabrik ist H0 die Annahme, dass zwei Maschinen im Mittel die gleiche Menge an Süßmasse verbrauchen. Wir gehen zunächst davon aus, dass kein Unterschied existiert. Alternativhypothese (H1):
Das ist die Behauptung, die wir nachweisen möchten. Sie besagt, dass es einen Unterschied gibt. Im Fabrikbeispiel lautet H1: Die Durchschnittsmengen der beiden Maschinen sind nicht gleich. Der Test zielt darauf ab, Beweise zu finden, die H0 unglaubwürdig machen. Wie vor Gericht muss der „Angeklagte“ (H0) nicht seine Unschuld beweisen; die Anklage (H1) muss genug Beweise sammeln, um die Unschuldshypothese zu verwerfen. Fehlerquellen: Alpha‑ und Beta‑Risiko
1. Fehler 1. Art (Alpha‑Risiko):
H0 wird verworfen, obwohl sie in Wahrheit gilt. In der Fabrik würde man fälschlicherweise glauben, dass ein Unterschied besteht und Maßnahmen ergreifen, obwohl beide Maschinen identisch sind. 2. Fehler 2. Art (Beta‑Risiko):
H0 wird beibehalten, obwohl sie falsch ist. Man übersieht einen echten Unterschied und verpasst damit Verbesserungsmöglichkeiten.Um das Alpha‑Risiko zu steuern, legt man vor dem Test das Signifikanzniveau (α) fest. In der Praxis ist 5 % (0,05) üblich, weil dieser Wert einen guten Kompromiss zwischen Sensitivität und Fehlalarmrate bietet. Je kleiner α gewählt wird, desto schwieriger ist es, H0 zu verwerfen – was bei sicherheitskritischen Anwendungen sinnvoll sein kann. P‑Wert und Entscheidungsregel
Einseitige und zweiseitige Tests
Werkzeuge im Überblick
Vergleich von Mittelwerten:
Der Zweistichproben‑T‑Test prüft, ob sich die Durchschnittswerte zweier unabhängiger Gruppen unterscheiden (z. B. Lutscherverbrauch zweier Maschinen). Bei großen Stichproben nähert sich der T‑Test dem Z‑Test an. Vergleich von Varianzen:
Der F‑Test vergleicht die Streuung zweier Prozesse (z. B. Präzision zweier Bestückungsautomaten). Er wird eingesetzt, wenn Stabilität wichtiger ist als der Mittelwert. Vergleich von Anteilen:
Tests für Proportionen (z. B. Chi‑Quadrat‑Test) untersuchen, ob sich Fehlerquoten oder Erfolgsraten signifikant unterscheiden (z. B. Fehlerquote bei zwei Bestellmethoden). Ein hoher P‑Wert bedeutet, dass beobachtete Unterschiede nicht signifikant sind. Praktische vs. statistische Signifikanz
Fazit
Cindy Heinzemann
Training, Coaching, KursentwicklungDank ihrer langjährigen und umfassenden Erfahrung in der Leitung von LEAN- und SIX SIGMA-Projekten sowie im Coaching begleitet Cindy Heinzemann unsere Teilnehmenden zielgerichtet durch die Kurse. Mit ihrem fundierten Fachwissen und ihrer positiven Art versteht sie es, theoretische Inhalte mit praxisnahen Erfahrungsberichten zu verbinden und dadurch den Lernerfolg zu gewährleisten. Als zertifizierte Nachhaltigkeitsmanagerin (TÜV) liegt es ihr sehr am Herzen, die Zukunftsfähigkeit für Neuentwicklungen oder Verbesserungen von Produkten und/oder Prozessen als Selbstverständlichkeit zu berücksichtigen und somit nachhaltige Lösungen zu gewährleisten.