Vad är förtroendeintervall?
Ett konfidensintervall, i statistik, avser sannolikheten att en populationsparameter kommer att falla mellan två inställda värden under en viss andel gånger. Förtroendesintervall mäter graden av osäkerhet eller säkerhet i en provtagningsmetod. Ett konfidensintervall kan ta valfritt antal sannolikheter, där det vanligaste är en konfidensnivå på 95% eller 99%.
Förtroendeintervall och förtroendegrad hänger samman men är inte exakt samma.
Förstå förtroendeintervall
Statistiker använder konfidensintervall för att mäta osäkerhet. Till exempel väljer en forskare olika prover slumpmässigt från samma population och beräknar ett konfidensintervall för varje prov. De resulterande datasätten är alla olika; vissa intervall inkluderar den verkliga populationsparametern och andra inte.
Ett konfidensintervall är ett intervall värden som sannolikt skulle innehålla en okänd populationsparameter. Konfidensnivå hänvisar till procentandelen av sannolikheten eller säkerheten att konfidensintervallet skulle innehålla den verkliga populationsparametern när du drar ett slumpmässigt prov många gånger. Eller, i det språkliga, "Vi är 99% säkra ( konfidensnivå) att de flesta av dessa datasätt (konfidensintervall) innehåller den verkliga populationsparametern."
Key Takeaways
- Ett konfidensintervall beräknar sannolikheten för att en populationsparameter kommer att falla mellan två inställda värden. Förtroendeintervall mäter graden av osäkerhet eller säkerhet i en provtagningsmetod. Ofta återspeglar konfidensintervall konfidensnivåer på 95% eller 99%.
Beräkna ett konfidensintervall
Anta att en grupp forskare studerar höjden hos basketbollsspelare i gymnasiet. Forskarna tar ett slumpmässigt urval från befolkningen och fastställer en medelhöjd på 74 tum. Medelvärdet 74 tum är en poänguppskattning av befolkningsmedlet. En poänguppskattning i sig är av begränsad användbarhet eftersom den inte avslöjar osäkerheten i samband med uppskattningen; du har inte en bra känsla för hur långt bort detta 74-tums provmedelvärde kan vara från befolkningsmedlet. Det som saknas är graden av osäkerhet i detta enda prov.
Förtroendeintervaller ger mer information än poänguppskattningar. Genom att fastställa ett 95% konfidensintervall med användning av provets medelvärde och standardavvikelse, och antar en normalfördelning som representeras av klockkurvan, kommer forskarna till en övre och undre gräns som innehåller det verkliga medelvärdet av 95% av tiden. Antag att intervallet är mellan 72 tum och 76 tum. Om forskarna tar 100 slumpmässiga prover från befolkningen i gymnasieskolebasketspelare som helhet, bör medelvärdet falla mellan 72 och 76 tum i 95 av dessa prover.
Om forskarna vill ha ännu större förtroende kan de utöka intervallet till 99% förtroende. Om du gör det skapas alltid ett bredare intervall eftersom det ger plats för ett större antal provmedel. Om de upprättar 99% konfidensintervall som mellan 70 tum och 78 tum, kan de förvänta sig att 99 av 100 prover utvärderas att innehålla ett medelvärde mellan dessa siffror. En konfidensnivå på 90% innebär att vi förväntar oss att 90% av intervallberäkningarna inkluderar populationsparametern. På samma sätt innebär en konfidensnivå på 99% att 95% av intervallen skulle inkludera parametern.
Vanliga missuppfattningar om förtroendeintervall
Den största missuppfattningen beträffande konfidensintervall är att de representerar procentandelen data från ett givet prov som faller mellan de övre och nedre gränserna. Till exempel kan man felaktigt tolka det ovannämnda 99% konfidensintervallet 70 till 78 tum som indikerar att 99% av data i ett slumpmässigt prov faller mellan dessa siffror. Detta är felaktigt, även om det finns en separat metod för statistisk analys för att göra en sådan bestämning. Det innebär att man identifierar provets medelvärde och standardavvikelse och plottar dessa figurer på en klockkurva.
