3-sigma-Regel und Signifikanzkriterien

Lieber Besucher, herzlich willkommen bei: MastersForum. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

yellow_crush

Erleuchteter

Beiträge: 2 951

Wohnort: MV

28.01.2015, 14:29

3-sigma-Regel und Signifikanzkriterien

Da ich weiß, dass sich im Masters der eine oder andere Statistiker rumtreibt, hier die Frage:

Warum werden in verschiedenen Wissenschaften unterschiedliche Signifikanzkriterien verwendet? Und vor allem: Wer definiert das? In meinen Fall, der Chemie werden gemeinhin Werte als "ununterscheidbar" angesehen, wenn diese sich im 3-sigma Bereich überlappen. Bei anderen Wissenschaften scheint das anders zu sein. Warum? Weiß da einer von euch was?

Dazu gleich noch eine Bitte:

http://www.tandfonline.com/doi/abs/10.10…30#.VMjjAyzRKB4

hätte ich gern, evtl hilft das als Referenz weiter, wenn man Menschen erklären muss, warum bei "uns" eben 3 sigma gelten ...

Danke im Vorraus,

crush

Zitat von »Lesmue« Wenn ich 2 Abende in der Woche mal Ruhe vor Frau,Freundin,Kindern usw hab will ich einfach ganz entspannt am Rechner was daddeln und mir dabei 3 Weizen in den Kopf jagen, und mit Kumpels dummes Zeug in Skype labern.

Zum Seitenanfang

_Icedragon_

Meister

Beiträge: 2 917

Wohnort: Seehausen am Staffelsee

Beruf: Statistiker

28.01.2015, 20:41

Kannst du die drei-Sigma-Regel "bei euch" näher erläutern? Letztendlich interessiert einen der p-Wert über das Gesamtexperiment, der sollte sehr klein, dann hast du einen guten Hinweis darauf, dass deine Nullhypothese verworfen werden kann. (http://de.wikipedia.org/wiki/Hypothese_%28Statistik%29, http://de.wikipedia.org/wiki/Statistischer_Test)
Oft wird 5%, 1%, oder 0.1 % verwendet, je nachdem wie gesichert man Aussagen treffen will.

Bei Signifikanz muss man aber aufpassen, siehe hier: http://imgs.xkcd.com/comics/significant.png
-> multiples Testen.

Letztendlich ist das auch nur ein philosophisches Konzept, was heutzutage in Fachkreisen auch stark diskutiert wird (was du aber nicht unbedingt tun musst).

live is live, nana nanana

Zitat

Original von -=)GWC(RaMsEs
von 50k könnte ich in münchen nicht mehr leben.

Zum Seitenanfang

OoK_Isch

Erleuchteter

Beiträge: 4 115

Wohnort: Hildesheim

Beruf: GER

28.01.2015, 22:08

Wenn schon xkcd, dann doch bitte aktuell! http://xkcd.com/1478/

Zum Seitenanfang

AtroX_Worf

Erleuchteter

Beiträge: 11 461

Wohnort: Hamburg

Beruf: GER

29.01.2015, 11:38

Der p-value ist ein Quantil der Verteilung der Teststatistik unter H_0. Um diesen berechnen zu können muss man folglich die komplette Vereteilung wissen. Wenn eine konkrete Verteilung (bspw. des Störterms) gegeben ist, dann ergibt sich daraus meist die Verteilung der Teststatistik unter H_0 und einigen zusätzlichen Annahmen an die Daten.

Ohne Verteilungsannahme des Störterms oder wenn zusätzlich andere Größen stochastisch sind bleibt oftmals nur eine asymptotische Betrachtung für die Verteilung der Teststatistik unter H_0. Bei der Berechnung des p-values vernachlässigt man dann, dass diese Verteilung nur asymptotisch gilt und nimmt die asymptotische Verteilung als wahre Verteilung.

Mit schwächeren Annahmen, komplizierten Verteilungen oder kompliezierten Teststatistiken kennt man die Verteilung der Teststatistik nicht. Wenn man jedoch weiß/annimmt, dass alle auftauchenden und resultierenden verteilungen endliche 2. Momente haben, dann kann man die Enden der Verteilung der Teststatistik auch mit diesen beiden Momenten abschätzen, á la Chebyshev-Ungleichung oder, bei unimodalen Verteilungen, mittels der Vysochanskij–Petunin Ungleichung. Allerdings wird dies nur selten benutzt.

Im landläufigen Sprachgebrauch verwendet man die Aussage "Signifikant bei k*sigma" im Bezug auf die Normalverteilung.
+/- 1*sigma korrespondiert ungefähr zu 68,2% Überdeckungswahrscheinlichkeit, +/- 2*sigma zu ca. 95,4% und +/- 3*sigma zu ca. 99,7%. Kürzlich bei der "Entdeckung" des Higgs-Boson sprachen die Physiker von "5 sigma". Dies impliziert einen p-value von ca. 3*10^-7. Anders ausgedrückt, nur in 3 von 10.000.000 Fällen würde man durch puren Zufall eine so extreme Stichprobe ziehen, dass man H_0 (keine Signifikanz) ablehnt und auf H_1 (Signifikanz = es gibt das Higgs-Boson) entscheidet, obwohl in Wahrheit H_0 richtig ist.

Es gibt Gründe für und gegen die Vereinfachung mittels der Normalverteilung.
Pro: Die Normalverteilung taucht als Grenzverteilung (Zentraler Grenzwertsatz) häufig auf.
Contra: Mit der Normalverteilung unterschätzt man häufig die sog. Tail-Probabilities, d.h. die W'keit für seltene Ereignisse. Das schlägt natürlich bei den p-values voll durch, da sie definitionsgemäß von seltenen Ereignissen abhängen (extremen Stichproben, so dass man auf H_1 entscheidet, obwohl H_0 gilt).

Wieso bei euch ausgerechnet 3*sigma gilt, kann ich nicht sagen. Es ist wohl eine Konvention, die noch "Entdeckungen" in ausreichend großer Zahl erlaubt, ohne dass "false positive", d.h. Entdeckungen, die es eigentlich gar nicht gibt, zu viel werden.

Zu dieser Problematik bspw. der sehr bekannte Aufsatz Why Most Published Research Findings Are False von John Ioannidis.

Zum Seitenanfang

MastersForum

3-sigma-Regel und Signifikanzkriterien

3-sigma-Regel und Signifikanzkriterien

Zitat

Ähnliche Themen