Onderscheidend vermogen

Het onderscheidend vermogen of onderscheidingsvermogen van een statistische toets is de kans om een nulhypothese terecht te verwerpen als een alternatieve hypothese de waarheid bevat. Het onderscheidingsvermogen drukt de kans uit dat er geen fout van de tweede soort (type II-fout) gemaakt wordt. Omdat de alternatieve hypothese vaak samengesteld is, zal het onderscheidend vermogen een functie zijn, aangegeven door γ {\displaystyle \gamma } (of ook wel door β {\displaystyle \beta } ), van de mogelijke waarden van de betrokken parameter onder de nulhypothese. Men gaat soms zelfs zo ver dat men deze functie uitbreidt tot alle waarden van de betrokken parameter, ook die onder de nulhypothese.

Als T {\displaystyle T} de toetsingsgrootheid van de toets is en K {\displaystyle K} het kritieke gebied, dan wordt voor h H 1 {\displaystyle h\in H_{1}} het onderscheidend vermogen gegeven door:

γ ( h ) = P ( T K | h ) {\displaystyle \gamma (h)=P(T\in K|h)}

Voorbeeld

Twee normaal verdeelde populaties A {\displaystyle A} en B {\displaystyle B} met een verschillende behandeling worden vergeleken op basis van steekproeven X {\displaystyle X} respectievelijk Y {\displaystyle Y} , elk van omvang n {\displaystyle n} . De standaardafwijkingen van beide populaties zijn aan elkaar gelijk, zeg σ {\displaystyle \sigma } , en de hypothesen voor de verwachtingswaarden luiden:

H 0 :   μ A = μ B {\displaystyle H_{0}:\ \mu _{A}=\mu _{B}}

tegen

H 1 :   μ A > μ B {\displaystyle H_{1}:\ \mu _{A}>\mu _{B}}

Als toetsingsgrootheid T {\displaystyle T} komt in aanmerking:

X ¯ Y ¯ {\displaystyle {\bar {X}}-{\bar {Y}}} ,

maar om de berekeningen eenvoudiger te maken kiest men:

T = X ¯ Y ¯ σ n 2 {\displaystyle T={\frac {{\bar {X}}-{\bar {Y}}}{\sigma }}{\sqrt {\frac {n}{2}}}}

Gezien de alternatieve hypothese wordt H 0 {\displaystyle H_{0}} verworpen voor grote waarden van T {\displaystyle T} . De kritieke waarde is z α {\displaystyle z_{\alpha }} , bepaald door:

P ( T z α | H 0 ) = α {\displaystyle P(T\geq z_{\alpha }|H_{0})=\alpha } ,

waarin α {\displaystyle \alpha } de verlangde onbetrouwbaarheid is. Het onderscheidend vermogen van deze toets, dat afhankelijk is van het verschil Δ = μ A μ B {\displaystyle \Delta =\mu _{A}-\mu _{B}} , is:

γ ( Δ ) = P ( T z α Δ ) = {\displaystyle \gamma (\Delta )=P(T\geq z_{\alpha }\mid \Delta )=}
= P ( T Δ σ n 2 z α Δ σ n 2   | Δ ) = {\displaystyle =P\left(\left.T-{\frac {\Delta }{\sigma }}{\sqrt {\frac {n}{2}}}\geq z_{\alpha }-{\frac {\Delta }{\sigma }}{\sqrt {\frac {n}{2}}}\ \right|\,\Delta \right)=}
= P ( Z > z α Δ σ n 2 ) {\displaystyle =P\left(Z>z_{\alpha }-{\frac {\Delta }{\sigma }}{\sqrt {\frac {n}{2}}}\right)}

Daarin is Z {\displaystyle Z} standaard normaal verdeeld.

Om bij een bepaalde grootte Δ {\displaystyle \Delta } van het verschil tussen de beide populaties een voldoend onderscheidende toets te hebben, kiest men de steekproefomvang zo dat de fout van de tweede soort bij dat verschil gelijk is aan een voorgeschreven waarde β {\displaystyle \beta } :

γ ( Δ ) = 1 β {\displaystyle \gamma (\Delta )=1-\beta } ,

dus:

β = P ( Z z α Δ σ n 2 ) {\displaystyle \beta =P\left(Z\leq z_{\alpha }-{\frac {\Delta }{\sigma }}{\sqrt {\frac {n}{2}}}\right)}

Daaruit volgt:

z α Δ σ n 2 = z β {\displaystyle z_{\alpha }-{\frac {\Delta }{\sigma }}{\sqrt {\frac {n}{2}}}=-z_{\beta }} ,

dus:

n = 2 ( σ Δ ( z α + z β ) ) 2 {\displaystyle n=2\left({\frac {\sigma }{\Delta }}(z_{\alpha }+z_{\beta })\right)^{2}}